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Introduction 


«Le web sera une encyclopédie du monde faite par le monde pour le monde. Il n'y 
aura plus d'informations ni de connaissances utiles qui ne soient pas disponibles, si 
bien que l'obstacle principal à la compréhension internationale et interpersonnelle et 
au développement personnel et institutionnel sera levé. Il faudrait une imagination 
plus débordante que la mienne pour prédire l'effet de ce développement sur 
l'humanité.» (Robert Beard, créateur du site A Web of Online Dictionaries, septembre 
1998) 

Ce livre se présente sous la forme d’une chronologie en 32 chapitres de 1974 à 
2010. Merci à toutes les personnes qui sont citées ici, pour leur temps et pour leur 
amitié. Sauf indication contraire, les citations proviennent des Entretiens du NEF (Net 
des études françaises), menés par l’auteure au fil des ans. 


1974 > Les débuts de l'internet 
[Résumé] 

L'internet naît en 1974, quinze ans avant le web. Vinton Cerf est souvent appelé le 
père de l'internet parce qu'il est le co-auteur en 1974 avec Bob Kahn du protocole 
TCP/IP (Transmission Control Protocol / Internet Protocol) nécessaire au bon 
fonctionnement du réseau. L’internet est d’abord mis en place aux États-Unis pour 
relier les agences gouvernementales, les universités et les centres de recherche, 
avant de débuter sa progression mondiale en 1983. L’internet trouve ensuite un 
nouveau souffle avec l'invention du web parTim Berners-Lee en 1990 puis le 
lancement du premier navigateur Mosaic en 1993. Vinton Cerf fonde l'Internet 
Society (ISOC) en 1992 pour promouvoir le développement du réseau. Interviewé 
en janvier 1998 par le quotidien Libération, il explique: «Le réseau fait deux choses 
(...): comme les livres, il permet d'accumuler de la connaissance. Mais, surtout, il la 
présente sous une forme qui la met en relation avec d'autres informations. Alors que, 
dans un livre, l'information est maintenue isolée.» 


L'internet naît en 1974 suite à la création du protocole TCP/IP (Transmission Control 
Protocol / Internet Protocol) par Vinton Cerf et Bob Kahn pour les échanges de 
données sur le réseau, quinze ans avant l’invention du web. 

Les premiers pas 

Vinton Cerf est souvent appelé le père de l'internet parce qu'il est le co-auteur en 
1974 avec Bob Kahn du protocole TCP/IP (Transmission Control Protocol / Internet 
Protocol) nécessaire au bon fonctionnement du réseau. 

L’internet est d’abord mis en place aux États-Unis pour relier les agences 
gouvernementales, les universités et les centre de recherche, avant de débuter sa 
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progression mondiale en 1983. Il trouve ensuite un nouveau souffle avec l'invention 
du web par Tim Berners-Lee en 1990 puis le lancement du premier navigateur 
Mosaic en 1993. 

Vinton Cerf fonde l'Internet Society (ISOC) en 1992 pour promouvoir le 
développement du réseau. Interviewé en janvier 1998 par le quotidien Libération, il 
explique: «Le réseau fait deux choses (...): comme les livres, il permet d'accumuler 
de la connaissance. Mais, surtout, il la présente sous une forme qui la met en relation 
avec d'autres informations. Alors que, dans un livre, l'information est maintenue 
isolée.» 

Le web étant facile d’utilisation grâce aux liens hypertextes reliant les documents 
entre eux, l’internet peut enfin être utilisé par le grand public dans les années 1990, 
et pas seulement par les usagers versés dans l’informatique. On compte 100 millions 
d’usagers en décembre 1997, avec un million de nouveaux usagers par mois, et 300 
millions d’usagers en décembre 2000. 

La situation en Europe 

En ce qui concerne la connexion à l’internet, les choses sont moins faciles en Europe 
qu’en Amérique du Nord. La connexion est d'abord tarifée à la durée, avec un tarif de 
jour très élevé et un tarif de nuit plus intéressant, d’où l’obligation de travailler la nuit 
pour éviter les factures trop élevées. Des mouvements de grève sont lancés fin 1998 
et début 1999 en France, en Italie et en Allemagne dans le but de faire pression sur 
les sociétés prestataires pour qu'elles baissent leurs prix et qu'elles proposent des 
forfaits internet, avec gain de cause les mois suivants. 

Quelques années plus tard, le haut débit se généralise. Jean-Paul, webmestre du 
site hypermédia cotres.net, résume la situation en janvier 2007: «J’ai l’impression 
que nous vivons une période "flottante", entre les temps héroïques, où il s’agissait 
d’avancer en attendant que la technologie nous rattrape, et le futur, où le très haut 
débit va libérer les forces qui commencent à bouger, pour l’instant dans les seuls 
jeux.» 

L’internet du futur 

L’internet du futur pourrait être un réseau pervasif permettant de se connecter en 
tout lieu et à tout moment sur tout type d’appareil à travers un réseau unique et 
omniprésent. 

Le concept de réseau pervasif est développé par Rafi Haladjian, fondateur de 
la société Ozone. Comme expliqué sur le site web en 2007, «la nouvelle vague 
touchera notre monde physique, notre environnement réel, notre vie quotidienne 
dans tous les instants. Nous n’accéderons plus au réseau, nous l’habiterons. Les 
composantes futures de ce réseau (parties filiaires, parties non filiaires, opérateurs) 
seront transparentes à l’utilisateur final. Il sera toujours ouvert, assurant une 
permanence de la connexion en tout lieu. Il sera également agnostique en terme 
d’application(s), puisque fondé sur les protocoles mêmes de l’internet.» Nous 
attendons cela avec impatience. 
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Quant au contenu de l’internet, Timothy Leary, philosophe visionnaire, le décrit ainsi 
dans son livre «Chaos et cyberculture?», publié en 1994: «Toute l’information du 
monde est à l’intérieur. Et grâce au cyberespace, tout le monde peut y avoir accès. 
Tous les signaux humains contenus jusque-là dans les livres ont été numérisés. Ils 
sont enregistrés et disponibles dans ces banques de données, sans compter tous 
les tableaux, tous les films, toutes les émissions de télé, tout, absolument tout.» En 
201 1 , nous n’en sommes pas encore là, mais les choses sont en bonne voie. 


1986 > Des extensions pour l'ASCII 
[Résumé] 

Avec le développement de l’internet hors de la sphère anglophone, communiquer 
uniquement en anglais devient insuffisant, d’où la nécessité de prendre en compte 
les caractères accentués d’autres langues européennes. Publié par l'American 
National Standards Institute (ANSI) en 1963, l'ASCII (American Standard Code 
for Information Interchange) est le premier système d'encodage. Il s'agit d'un code 
standard de 128 caractères traduits en langage binaire sur sept bits (A est traduit 
par «1000001 », B est traduit par «1000010», etc.). L'ASCII permet uniquement la 
lecture de l'anglais (et du latin). Des variantes de l'ASCII sur huit bits sont publiées 
à partir de 1986 pour prendre en compte les caractères accentués de quelques 
langues européennes. La variante pour le français, l’espagnol et l’allemand (entre 
autres) est la norme ISO 8859-1 (Latin-1). Mais les problèmes sont loin d’être 
résolus. Pour cela, il faudra attendre l’Unicode, nouveau système d’encodage 
universel dont la première version est publiée en janvier 1991 . 


Avec le développement de l’internet hors de la sphère anglophone, communiquer 
uniquement en anglais devient insuffisant, d’où la nécessité de prendre en compte 
les caractères accentués de plusieurs langues européennes. 

L’ASCII sur 7 bits 

Le premier système d'encodage informatique est l’ASCII (American Standard 
Code for Information Interchange). Publié en 1963 aux États-Unis par l’American 
National Standards Institute (ANSI), l'ASCII est un code standard de 128 caractères 
traduits en langage binaire sur sept bits (A est traduit par «1000001 », B est traduit 
par «1000010», etc.). Les 128 caractères comprennent 33 caractères de contrôle 
(qui ne représentent donc pas de symbole écrit) et 95 caractères imprimables: les 26 
lettres sans accent en majuscules (A-Z) et minuscules (a-z), les chiffres, les signes 
de ponctuation et quelques caractères spéciaux, le tout correspondant aux touches 
du clavier anglophone. 

L’ASCII sur 8 bits 

L'ASCII permet uniquement la lecture de l’anglais (et du latin). L’ASCII ne permet 
donc pas de prendre en compte les lettres accentuées présentes dans bon nombre 
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de langues européennes (français, espagnol, allemand, etc.), tout comme les 
langues disposant d’autres alphabets (arabe, grec, russe, etc.) et à plus forte raison 
les langues non alphabétiques (chinois, coréen, japonais, etc.). Ceci ne pose pas de 
problème majeur les premières années, tant que l’échange de fichiers électroniques 
se limite surtout à l’Amérique du Nord. Mais le multilinguisme devient bientôt une 
nécessité vitale. Des variantes de l’ASCII sur huit bits sont publiées à partir de 
1986 pour prendre en compte les caractères accentués de quelques langues 
européennes. La variante pour le français, l’espagnol et l’allemand (entre autres) est 
la norme ISO 8859-1 (ISO Latin-1). 

Un véritable casse-tête 

Avec le développement de l’internet, l’échange des données s’internationalise encore 
davantage. Même avec des variantes de l’ASCII, on ne peut décidément plus se 
limiter à l’utilisation d’un système d’encodage datant des débuts de l’informatique. 

De plus, le passage de l’ASCII original à ses différentes variantes devient vite un 
véritable casse-tête, y compris au sein de l’Union européenne, les problèmes étant 
entre autres la multiplication des variantes, la corruption des données dans les 
échanges informatiques ou encore l’incompatibilité des systèmes, les pages ne 
pouvant être affichées que dans une seule langue à la fois. 

Olivier Gainon, fondateur de CyLibris et pionnier de l’édition électronique littéraire, 
écrit à ce sujet en décembre 2000: «Il faut que le réseau respecte les lettres 
accentuées, les lettres spécifiques, etc. Je crois très important que les futurs 
protocoles permettent une transmission parfaite de ces aspects - ce qui n’est pas 
forcément simple (dans les futures évolutions de l’HTML ou des protocoles IP, 
etc.). Donc il faut que chacun puisse se sentir à l’aise avec l’internet et que ce ne 
soit pas simplement réservé à des (plus ou moins) anglophones. Il est anormal 
aujourd’hui que la transmission d’accents puisse poser problème dans les courriers 
électroniques. La première démarche me semble donc une démarche technique. 

Si on arrive à faire cela, le reste en découle: la représentation des langues se fera 
en fonction du nombre de connectés, et il faudra envisager à terme des moteurs de 
recherche multilingues.» 

L’ Unicode 

Publié pour la première fois en janvier 1991, l’Unicode est un système d'encodage 
universel sur 16 bits spécifiant un nombre unique pour chaque caractère. Ce nombre 
est lisible quels que soient la plateforme, le logiciel et la langue utilisés. L’Unicode 
peut traiter 65.000 caractères uniques et prendre en compte tous les systèmes 
d’écriture de la planète. L’Unicode est progressivement adopté à partir de 1998. Un 
énorme travail est en effet nécessaire pour sa prise en compte par tous les logiciels 
et navigateurs web. Il faudra attendre décembre 2007 pour que l’Unicode supplante 
l’ASCII sur l’internet. 
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1990 > Le web booste l’internet 


[Résumé] 

Le World Wide Web est inventé en 1990 par Tim Berners-Lee, alors chercheur au 
CERN (Centre européen pour la recherche nucléaire) à Genève, en Suisse. En 1989, 
il met au point l'hypertexte pour relier des documents entre eux. En 1990, il met au 
point le premier serveur HTTP (HyperText Transfer Protocol) et le premier navigateur 
web. En 1991, le web est opérationnel et rend l'internet (qui existe depuis 1974) 
accessible à tous et pas seulement aux usagers versés dans l’informatique. Des 
liens hypertextes permettent désormais de passer d'un document textuel ou visuel à 
un autre au moyen d'un simple clic de souris. Plus tard, cette interactivité est encore 
accrue avec la possibilité de liens hypermédias permettant de lier des textes et des 
images à des vidéos ou bandes sonores. Le World Wide Web Consortium (W3C) est 
fondé en octobre 1994 pour développer les protocoles communs du web. 


Le World Wide Web est inventé en 1990 par Tim Berners-Lee, chercheur au CERN 
(Centre européen pour la recherche nucléaire) à Genève, en Suisse. Le web rend 
l’internet accessible à tous et lui permet une progression exponentielle. 

Les débuts du web 

En 1989, Tim Berners-Lee met au point l’hypertexte pour relier des documents entre 
eux. En 1990, il met au point le premier serveur HTTP (HyperText Transfer Protocol) 
et le premier navigateur web. En 1991, le World Wide Web est opérationnel et rend 
l'internet (qui existe depuis 1974) accessible à tous et pas seulement aux usagers 
versés dans l’informatique. Des liens hypertextes permettent désormais de passer 
d'un document textuel à un autre au moyen d'un clic de souris. Plus tard, cette 
interactivité est encore accrue avec la possibilité de liens hypermédias permettant de 
lier textes et images fixes à des vidéos ou bandes sonores. 

Mosaic est le premier navigateur destiné au grand public. Développé par le NSCA 
(National Centerfor Supercomputing Applications) à l'Université de l'Illinois (États- 
Unis) et distribué gratuitement en novembre 1993, il contribue largement au 
développement rapide du web. Début 1994, une partie de l'équipe de Mosaic émigre 
dans la Netscape Communications Corporation pour développer un nouveau logiciel 
sous le nom de Netscape Navigator. En 1995, Microsoft lance son propre navigateur, 
l'Internet Explorer. Viennent ensuite d'autres navigateurs, comme Opéra ou Safari, le 
navigateur d'Apple. 

Un consortium industriel international est fondé en octobre 1994 pour développer les 
protocoles communs du web, sous le nom de World Wide Consortium (W3C) et sous 
l’égide de Tim Berners-Lee. En 1997, une section Internationalization / Localization 
regroupe les protocoles utilisés pour créer un site web multilingue: HTML (HyperText 
Markup Language), jeux (de base) de caractères, nouveaux attributs, HTTP 
(HyperText Transfer Protocol), négociation de la langue, URL (Uniform Resource 
Locator) et autres identificateurs incluant des caractères non ASCII, conseils divers. 
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Le rêve de Tim Berners-Lee 


À la question de Pierre Ruetschi, journaliste à la Tribune de Genève, quotidien 
suisse: «Sept ans plus tard, êtes-vous satisfait de la façon dont le web a évolué?», 
Tim Berners-Lee répond en décembre 1997 que, s’il est heureux de la richesse et 
de la variété de l’information disponible, le web n’a pas encore la puissance prévue 
dans sa conception d’origine. Il aimerait «que le web soit plus interactif, que les gens 
puissent créer de l’information ensemble», et pas seulement consommer celle qui 
leur est proposée. Le web doit devenir «un média de collaboration, un monde de 
connaissance que nous partageons». 

Dans un essai publié en avril 1998 sur sa propre page web (sur le site du World 
Wide Web Consortium), Tim Berners-Lee explique que «le rêve derrière le web est 
un espace d'information commun dans lequel nous communiquons en partageant 
l'information. Son universalité est essentielle, à savoir le fait qu'un lien hypertexte 
puisse pointer sur quoi que ce soit, quelque chose de personnel, de local ou de 
global, aussi bien une ébauche qu'une réalisation très sophistiquée. Deuxième partie 
de ce rêve, le web deviendrait d'une utilisation tellement courante qu'il serait un 
miroir réaliste (sinon la principale incarnation) de la manière dont nous travaillons, 
jouons et nouons des relations sociales. Une fois que ces interactions seraient en 
ligne, nous pourrions utiliser nos ordinateurs pour nous aider à les analyser, donner 
un sens à ce que nous faisons, et voir comment chacun trouve sa place et comment 
nous pouvons mieux travailler ensemble.» (extrait de «The World Wide Web: a very 
short personal history») 

Le web 2.0 

Selon Netcraft, société spécialisée dans les mesures d’audience, le nombre de sites 
web passe d’un million de sites (avril 1997) à dix millions de sites (février 2000), 20 
millions de sites (septembre 2000), 30 millions de sites (juillet 2001), 40 millions de 
sites (avril 2003), 50 millions de sites (mai 2004), 60 millions de sites (mars 2005), 

70 millions de sites (août 2005), 80 millions de sites (avril 2006), 90 millions de sites 
(août 2006) et 100 millions de sites (novembre 2006), une augmentation rapide 
favorisée par l’explosion des sites personnels et des blogs. 

Le web 2.0, terme lancé en 2004 par Tim O’Reilly, éditeur de livres informatiques, 
apporte peut-être un début de réponse au rêve de Tim Berners-Lee puisqu’il est 
basé sur les notions de communauté et de partage. 

Quinze ans après la création du web, le magazine Wired constate dans son numéro 
d'août 2005 que «moins de la moitié du web est commercial, le reste fonctionne avec 
la passion». Quant à l'internet, d'après le quotidien Le Monde du 19 août 2005, «ses 
trois pouvoirs - l'ubiquité, la variété et l'interactivité - rendent son potentiel d'usages 
quasi infini». 

Robert Beard, professeur de langues et créateur du site A Web of Online Dictionaries 
en 1995, écrivait de manière prémonitoire dès septembre 1998: «Le web sera 
une encyclopédie du monde faite par le monde pour le monde. Il n'y aura plus 
d'informations ni de connaissances utiles qui ne soient pas disponibles, si bien 
que l'obstacle principal à la compréhension internationale et interpersonnelle et au 
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développement personnel et institutionnel sera levé. Il faudrait une imagination plus 
débordante que la mienne pour prédire l'effet de ce développement sur l'humanité.» 


1990 > La LINGUIST List 

[Résumé] 

Liste de diffusion à destination des linguistes, la LINGUIST List est créée par 
Anthony Rodrigues Aristar en 1990 au sein de l’University of Western Australia. Avec 
60 inscrits, la liste déménage vers la Texas A&M University (États-Unis) en 1991, 
l'Eastern Michigan University étant le principal éditeur. En 1997, la LINGUIST List 
dispose de son propre site web. Les messages reçus sont classés dans diverses 
rubriques: profession (conférences, associations linguistiques, programmes), 
recherche et soutien à la recherche (articles, résumés de mémoires, projets, 
bibliographies, sujets, textes), publications, pédagogie, ressources linguistiques 
(langues, familles linguistiques, dictionnaires, informations régionales) et soutien 
informatique (polices de caractères et logiciels). La LINGUIST List est une 
composante de la WWW Virtual Library pour la linguistique. 


Liste de diffusion à destination des linguistes, la LINGUIST List est créée par 
Anthony Rodrigues Aristar en 1990 au sein de l’University of Western Australia. 

Avec 60 inscrits, la liste déménage vers la Texas A&M University (États-Unis) en 
1991, l'Eastern Michigan University étant le principal éditeur. 

En 1997, la LINGUIST List dispose de son propre site web. Les messages reçus sont 
classés dans diverses rubriques: profession (conférences, associations linguistiques, 
programmes), recherche et soutien à la recherche (articles, résumés de mémoires, 
projets, bibliographies, sujets, textes), publications, pédagogie, ressources 
linguistiques (langues, familles linguistiques, dictionnaires, informations régionales) 
et soutien informatique (polices de caractères et logiciels). La LINGUIST List est une 
composante de la WWW Virtual Library pour la linguistique. 

Helen Dry, co-modératrice de la LINGUIST List depuis 1991, explique en août 
1998: «La LINGUIST List, que je modère, a pour politique d'accepter les informations 
dans toutes les langues, puisque c'est une liste pour linguistes. Nous ne souhaitons 
cependant pas que le message soit publié dans plusieurs langues, tout simplement 
à cause de la charge de travail que cela représenterait pour notre personnel de 
rédaction. (Nous ne sommes pas une liste fourre-tout, mais une liste modérée. De 
ce fait, avant d'être publié, chaque message est classé par nos étudiants-rédacteurs 
dans une section comprenant des messages du même type.) Notre expérience nous 
montre que pratiquement tout le monde choisit de publier en anglais. Mais nous 
relions ces informations à un système de traduction présentant nos pages dans cinq 
langues différentes. Ainsi un abonné ne lit LINGUIST en anglais que s'il le souhaite. 
Nous essayons aussi d'avoir au moins un étudiant-éditeur qui soit réellement 
multilingue, afin que les lecteurs puissent correspondre avec nous dans d'autres 
langues que l'anglais.» 
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Helen Dry ajoute en juillet 1999: «Nous commençons maintenant à rassembler 
un grand nombre de données. Par exemple, nous avons des bases de données 
avec moteur de recherche pour les résumés de thèses de linguistique, pour les 
informations sur les programmes universitaires de linguistique et pour les données 
professionnelles de linguistes individuels. À ma connaissance, le fichier des résumés 
de thèses est la seule compilation électronique qui soit disponible gratuitement sur 
l’internet.» 


1991 > L'Unicode, système d'encodage universel 
[Résumé] 

L’ASCII, premier système d’encodage datant des débuts de l’informatique, n’est plus 
suffisant avec l’internationalisation de l’internet, d’où l’intérêt de l’Unicode, nouveau 
système d’encodage universel, dont la première version est publiée en janvier 
1991. L'Unicode spécifie un nombre sur 16 bits unique à chaque caractère (ou 
idéogramme) et lisible quels que soient la plateforme, le logiciel et la langue utilisés. 
L'Unicode peut traiter 65.000 caractères et prendre en compte tous les systèmes 
d'écriture de la planète. Il devient une composante des spécifications du World Wide 
Web Consortium (W3C), l'organisme international chargé du développement du 
web. L’utilisation de l’Unicode se généralise à partir de 1998, par exemple pour les 
fichiers texte sous plateforme Windows (Windows NT, Windows 2000, Windows 
XP et versions suivantes), qui étaient jusque-là en ASCII. L’Unicode supplante 
définitivement l’ASCII en décembre 2007. 


L’ASCII n’est plus suffisant avec l’internationalisation de l’internet, d’où l’intérêt de 
l’Unicode, nouveau système d’encodage universel, dont la première version est 
publiée en janvier 1991. 

Contrairement à l’ASCII conçu pour l’anglais (et le latin), avec des variantes pour 
quelques langues supplémentaires, l’Unicode prend en compte toutes les langues de 
la planète. 

De I’ ASCII à l’Unicode 

Pour mémoire, le premier système d'encodage informatique est l’ASCII (American 
Standard Code for Information Interchange), publié en 1963 aux États-Unis par 
l’American National Standards Institute (ANSI) pour encoder des informations en 
anglais. 

Mais le multilinguisme devient bientôt une nécessité vitale. Des variantes de l’ASCII 
prennent en compte d’autres langues à partir de 1986. Avec le développement de 
l’internet, l’échange des données s’internationalise de plus en plus, si bien qu’il 
n’est plus possible de se limiter à un système d’encodage datant des débuts de 
l’informatique, même avec ses variantes. 
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Publié pour la première fois en janvier 1991, l’Unicode est un système d'encodage 
universel sur 16 bits spécifiant un nombre unique pour chaque caractère (ou 
idéogramme). Ce nombre est lisible quels que soient la plateforme, le logiciel et 
la langue utilisés. L’Unicode peut traiter 65.000 caractères uniques et prendre en 
compte tous les systèmes d’écriture de la planète. À la grande satisfaction des 
linguistes, il remplace progressivement l’ASCII, avec des variantes UTF-8, UTF-16 et 
UTF-32 (UTF: Unicode Transformation Format) selon le nombre de bits utilisés pour 
l’encodage. 

L'Unicode est maintenu par l'Unicode Consortium. Il devient une composante des 
spécifications du World Wide Web Consortium (W3C), fondé en octobre 1994 pour 
promouvoir le développement du web. L’utilisation de l’Unicode se généralise à partir 
de 1998, par exemple pour les fichiers texte sous plateforme Windows (Windows NT, 
Windows 2000, Windows XP et versions suivantes), qui étaient jusque-là en ASCII. 

Une tâche énorme 

Mais la tâche s’annonce rude. Patrick Rebollar, professeur de français et de 
littérature française au Japon et modérateur de la liste de diffusion LITOR (Littérature 
et ordinateur), précise en janvier 2000: «Il s'agit d'abord d'un problème logiciel. 
Comme on le voit avec Netscape ou Internet Explorer, la possibilité d'affichage 
multilingue existe. La compatibilité entre ces logiciels et les autres (de la suite 
Office de Microsoft, par exemple) n'est cependant pas acquise. L'adoption de 
la table Unicode devrait résoudre une grande partie des problèmes, mais il faut 
pour cela réécrire la plupart des logiciels, ce à quoi les producteurs de logiciels 
rechignent du fait de la dépense, pour une rentabilité qui n'est pas évidente car ces 
logiciels entièrement multilingues intéressent moins de clients que les logiciels de 
navigation.» 

Luc DaN’Armellina, co-auteur et webmestre d’oVosite, un espace d’écriture 
hypermédia, écrit en juin 2000: «Les systèmes d’exploitation se dotent peu à 
peu des kits de langues et bientôt peut-être de polices de caractères Unicode à 
même de représenter toutes les langues du monde; reste que chaque application, 
du traitement de texte au navigateur web, emboîte ce pas. Les difficultés sont 
immenses: notre clavier avec ses ± 250 touches avoue ses manques dès lors qu’il 
faille saisir des Katakana ou Hiragana japonais, pire encore avec la langue chinoise. 
La grande variété des systèmes d’écriture de par le monde et le nombre de leurs 
signes font barrage. Mais les écueils culturels ne sont pas moins importants, liés 
aux codes et modalités de représentation propres à chaque culture ou ethnie.» Un 
sentiment prémonitoire puisque l’Unicode ne supplantera l’ASCII qu’en décembre 
2007. 


1994 > Travlang, des langues pour voyager 
[Résumé] 

Les premiers dictionnaires de langues en ligne sont d’un niveau très moyen, mais 
il faut un début à tout et ils dépannent les voyageurs. En 1994, Michael C. Martin, 
étudiant en physique, crée d’abord une rubrique intitulée «Foreign Languages 
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for Travelers» sur le site de son université à New York. L'année suivante, il lance 
Travlang, un site dédié à la fois aux voyages et aux langues, nommé meilleur 
site de voyages en 1997. En août 1998, la section «Foreign Languages for 
Travelers» permet d'apprendre les rudiments de soixante langues sur le web. La 
section «Translating Dictionaries» donne accès à des dictionnaires gratuits dans 
quinze langues (afrikaans, allemand, danois, espagnol, espéranto, finnois, français, 
frison, hollandais, hongrois, italien, latin, norvégien, portugais, tchèque). Ces 
dictionnaires sont le plus souvent sommaires et de qualité inégale. D’autres sections 
offrent des liens vers des services de traduction, des écoles de langue, des librairies 
multilingues, etc. 


Les premiers dictionnaires de langues disponibles sur le web - tels ceux de Travlang 
- sont d’un niveau très moyen, mais il faut un début à tout. Ils dépannent les 
voyageurs et fraient une voie aux bons sites de dictionnaires qui suivront ensuite. 

En 1994, Michael C. Martin, étudiant en physique, crée d’abord une rubrique 
intitulée «Foreign Languages for Travelers» sur le site de son université à New 
York, pour apprendre les langues sur le web. Cette rubrique s'étoffe rapidement et 
rencontre un grand succès. L'année suivante, il lance Travlang, un site dédié à la 
fois aux voyages et aux langues, nommé meilleur site de voyages en 1997. Devenu 
chercheur en physique au Lawrence Berkeley National Laboratory (Californie), 
Michael continue de gérer Travlang lui-même. 

En 1998, la section «Foreign Languages for Travelers» permet d’apprendre les 
rudiments de soixante langues sur le web. La section «Translating Dictionaries» 
donne accès à des dictionnaires gratuits dans quinze langues (afrikaans, allemand, 
danois, espagnol, espéranto, finnois, français, frison, hollandais, hongrois, italien, 
latin, norvégien, portugais, tchèque). Ces dictionnaires sont le plus souvent 
sommaires et de qualité inégale. 

D’autres sections offrent des liens vers des services de traduction, des écoles de 
langue, des librairies multilingues, etc. On peut également réserver son hôtel, sa 
voiture ou son billet d’avion, s’informer des taux de change ou encore consulter un 
index de 7.000 liens vers d’autres sites de langues et de voyages. 

Michael C. Martin écrit en août 1998: «Je pense que le web est un endroit idéal 
pour rapprocher les cultures et les personnes, et ceci inclut d'être multilingue. Notre 
site Travlang est très populaire pour cette raison, et les gens aiment le contact 
avec d'autres parties du monde. (...) L'internet est vraiment un outil important pour 
communiquer avec des gens avec lesquels on n'aurait pas l'occasion de dialoguer 
autrement. J'apprécie vraiment la collaboration générale qui a rendu possibles les 
pages de Foreign Languages for Travelers.» 

En ce qui concerne l’avenir, «je pense que les traductions intégrales informatisées 
vont devenir monnaie courante, et qu'elles permettront de communiquer à la base 
avec davantage de gens. Ceci aidera aussi à amener davantage l'internet au monde 
non anglophone.» 
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Travlang est acquis en février 1999 par la société GourmetMarket.com, puis racheté 
en janvier 2000 par la société iiGroup. En juillet 2000, le site compte 2 millions de 
visiteurs par mois. C’est l’époque où on commence à trouver de bons dictionnaires 
sur l’internet... mais sur d’autres sites, Travlang étant devenu commercial à 200%, 
dans le pire sens du terme, est désormais uniquement axé sur les voyages. 


1995 > L’Internet Dictionary Project 
[Résumé] 

Tyler Chambers, informaticien, crée d’abord en mai 1994 la Human-Languages Page 
(H-LP) pour proposer un index des ressources linguistiques disponibles sur l’internet 
dans diverses langues. Puis il lance en parallèle en 1995 l'Internet Dictionary Project 
(IDP), à savoir un projet coopératif ouvert à tous pour constituer des dictionnaires 
en accès libre sur le web, de l'anglais vers d'autres langues (allemand, espagnol, 
français, italien, latin, portugais). Comme expliqué sur le site web, «le but est de 
créer des dictionnaires de traduction grâce à l'aide des internautes. Ce site permet 
aux usagers du monde entier de les consulter et de participer à la traduction 
de termes anglais dans d'autres langues. Les listes de termes anglais et leurs 
correspondants dans d'autres langues sont ensuite mis à la disposition de tous sur 
ce site, sans restriction d'aucune sorte.» 


Tyler Chambers, informaticien, lance l’Internet Dictionary Project (IDP) en 1995 en 
tant que projet coopératif ouvert à tous pour constituer des dictionnaires en accès 
libre sur le web. 

Un an auparavant, Tyler crée la Human-Languages Page (H-LP) pour proposer 
un répertoire de ressources linguistiques. Ce répertoire recense 1.800 ressources 
dans une centaine de langues en octobre 1998. Ces ressources sont classées 
dans plusieurs rubriques: langues et littérature, écoles et institutions, ressources 
linguistiques, produits et services, organismes, emplois et stages, dictionnaires, 
cours de langues. 

Quant à l’Internet Dictionary Project, son but est de créer des dictionnaires de 
traduction de l'anglais vers d'autres langues (allemand, espagnol, français, italien, 
latin, portugais). 

Comme expliqué à l’époque sur le site web, «le but est de créer des dictionnaires 
de traduction grâce à l'aide des internautes. Ce site permet aux usagers du monde 
entier de les consulter et de participer à la traduction de termes anglais dans d'autres 
langues. Les listes de termes anglais et leurs correspondants dans d'autres langues 
sont ensuite mis à la disposition de tous sur ce site, sans restriction d'aucune sorte. 
(...) 


L'Internet Dictionary Project a débuté en 1995 pour combler une lacune et procurer 
des dictionnaires de traduction gratuits à la communauté des internautes et à 
tous ceux qui s'intéressent à l'informatique. Non seulement il est très utile d'avoir 
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immédiatement accès à des dictionnaires par le World Wide Web, mais ceci permet 
aussi le développement de logiciels pouvant tirer parti de tels dictionnaires, que ce 
soit des programmes de traduction ou des vérificateurs d'orthographe ou encore des 
guides d'apprentissage des langues. En facilitant la création de ces dictionnaires en 
ligne par des milliers de volontaires, et en les mettant gratuitement à la disposition de 
tous, l'Internet Dictionary Project espère imprimer sa marque sur l'internet et susciter 
d'autres projets qui seront plus bénéfiques que de générer des revenus purement 
financiers.» 

Tyler Chambers raconte en septembre 1998 lors d'un entretien par courriel: «Le 
multilinguisme sur le web était inévitable bien avant que ce médium ne se développe 
vraiment. Mon premier vrai contact avec le web date de 1994, un peu après ses 
débuts mais bien avant son expansion. 1994 a été aussi l'année où j'ai débuté mon 
premier projet web multilingue, et il existait déjà un nombre significatif de ressources 
linguistiques en ligne. Ceci était antérieur à la création de Netscape. Mosaic était le 
seul navigateur sur le web, et les pages web étaient essentiellement des documents 
textuels reliés par des hyperliens. Avec l'amélioration des navigateurs et l'expérience 
acquise par les usagers, je ne pense pas qu'il existe une langue vivante qui ne soit 
pas maintenant représentée sur le web, que ce soit la langue des Indiens d'Amérique 
ou les dialectes moyen-orientaux. De même une pléthore de langues mortes peut 
maintenant trouver une audience nouvelle avec des érudits et autres spécialistes en 
ligne. (...) 

Bien que je ne sois pas multilingue, ni même bilingue moi-même, je suis conscient 
du fait que très peu de domaines ont une importance comparable à celle des langues 
et du multilinguisme. (...) Dans l'ensemble, je pense que le web est important pour 
la sensibilisation aux langues et pour les questions culturelles. Dans quel autre 
endroit peut-on chercher au hasard pendant vingt minutes et trouver des informations 
susceptibles de vous intéresser dans trois langues différentes sinon plus? (...) 

Dire que l'internet aiguillonne le multilinguisme est à mon sens une opinion fausse. 
C'est la communication qui aiguillonne le multilinguisme et l'échange multiculturel. 
L'internet est seulement le mode de communication le plus récent qui soit accessible 
aux gens plus ou moins ordinaires. (...) Les langues deviendront encore plus 
importantes qu'elles ne le sont lorsque tout le monde pourra communiquer à l'échelle 
de la planète (à travers le web, les discussions, les jeux, le courrier électronique, ou 
toute application appartenant encore au domaine de l'avenir).» 

Au printemps 2001 , la Human-Languages Page fusionne avec le Languages 
Catalog, une section de la WWW Virtual Library, pour devenir iLoveLanguages. En 
septembre 2003, iLoveLanguages offre 2.000 ressources linguistiques dans une 
centaine de langues. Quant à l'Internet Dictionary Project, Tyler Chambers y met fin 
en janvier 2007, faute de temps, tout en laissant les dictionnaires existants tels quels 
pour consultation ou téléchargement. 
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1995 > NetGlos, glossaire de l’internet 


[Résumé] 

NetGlos - abrégé de «Multilingual Glossary of Internet Terminology» - est lancé en 
1995 à l'initiative du WorldWide Language Institute (WWLI), un institut enseignant les 
langues via l'internet. NetGlos est un projet collaboratif en treize langues (allemand, 
anglais, chinois, croate, espagnol, français, grec, hébreu, hollandais/flamand, 
italien, maori, norvégien, portugais), avec la participation de nombreux traducteurs 
volontaires et autres professionnels des langues dans le monde entier. Comme 
expliqué en septembre 1998 par Brian King, directeur du WorldWide Language 
Institute, «avant qu'un nouveau terme ne soit accepté comme le terme correct, il y a 
une période d'instabilité avec plusieurs candidats en compétition. Souvent un terme 
emprunté à l'anglais est le point de départ et, dans de nombreux cas, il est aussi le 
point d'arrivée. Finalement émerge un vainqueur qui est ensuite utilisé aussi bien 
dans les dictionnaires techniques que dans le vocabulaire quotidien de l'usager non 
spécialiste.» 


NetGlos - abrégé de «Multilingual Glossary of Internet Terminology» - est un 
glossaire coopératif lancé en 1995 à l'initiative du WorldWide Language Institute 
(WWLI), un institut enseignant les langues via l’internet. 

Trois ans plus tard, NetGlos est disponible en treize langues (allemand, anglais, 
chinois, croate, espagnol, français, grec, hébreu, hollandais/flamand, italien, maori, 
norvégien, portugais), avec la participation de nombreux traducteurs et autres 
professionnels des langues dans le monde entier. 

Brian King, directeur du WorldWide Language Institute, explique en septembre 
1998: «Une grande partie de la terminologie technique disponible sur le web n'est 
pas encore traduite dans d'autres langues [que l’anglais]. Et, comme nous nous en 
sommes rendus compte dans NetGlos, la traduction de ces termes n'est pas toujours 
facile. Avant qu'un nouveau terme ne soit accepté comme le terme correct, il y a 
une période d'instabilité avec plusieurs candidats en compétition. Souvent un terme 
emprunté à l'anglais est le point de départ et, dans de nombreux cas, il est aussi le 
point d'arrivée. Finalement émerge un vainqueur qui est ensuite utilisé aussi bien 
dans les dictionnaires techniques que dans le vocabulaire quotidien de l'usager non 
spécialiste. La dernière version de NetGlos est la version russe, et elle devrait être 
disponible dans deux semaines environ [à savoir fin septembre 1998], Elle sera 
sans nul doute un excellent exemple du processus dynamique en cours pour la 
russification de la terminologie du web.» 

Quelles sont les perspectives? «La technologie change à une allure frénétique. 
L'apprentissage durant toute la vie est une stratégie que nous devons tous adopter 
si nous voulons rester en tête et être compétitifs. C'est une tâche qui est déjà assez 
difficile dans un environnement anglophone. Si nous ajoutons à cela la complexité 
apportée par la communication dans un cyberespace multilingue et multiculturel, la 
tâche devient encore plus astreignante. Probablement davantage encore que par 
le passé, la coopération est aussi indispensable que la concurrence. Les germes 
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d'une coopération par le biais de l'internet existent déjà. Notre projet NetGlos dépend 
du bon vouloir de traducteurs volontaires dans de nombreux pays: Canada, États- 
Unis, Autriche, Norvège, Belgique, Israël, Portugal, Russie, Grèce, Brésil, Nouvelle- 
Zélande, etc. À mon avis, les centaines de visiteurs qui consultent quotidiennement 
les pages de NetGlos constituent un excellent témoignage du succès de ce type de 
relations de travail. Les relations de coopération s'accroîtront encore à l'avenir, mais 
pas nécessairement sur la base du volontariat.» 


1995 > Plusieurs langues sur notre écran 
[Résumé] 

Comment se débrouiller pour afficher plusieurs langues à l’écran? Yoshi Mikami, 
informaticien à Fujisawa (Japon), lance d’abord un site web en décembre 1995 
avant d’écrire le premier livre sur le sujet en août 1997. Son site bilingue anglais- 
japonais «The Languages of the World by Computers and the Internet» est plus 
connu sous le nom de Kotoba Home Page ou Logos Home Page (à ne pas 
confondre avec le site de la société de traduction Logos, lancé deux ans plus 
tard). La Kotoba Home Page donne un bref historique de chaque langue, ses 
caractéristiques, sa phonétique, son jeu de caractères et son encodage informatique. 
Fort de cette expérience, Yoshi Mikami co-écrit ensuite (avec Kenji Sekine et 
Nobutoshi Kohara) le premier livre sur le sujet, «Pour un web multilingue», publié en 
japonais par les éditions O’Reilly en août 1997 avant d'être traduit l’année suivante 
en anglais, en allemand et en français. 

*** 


Comment se débrouiller pour afficher plusieurs langues à l’écran? Yoshi Mikami 
lance d’abord un site web en décembre 1995 avant de publier le premier livre au 
monde sur le sujet en août 1997. 

Yoshi Mikami, qui travaille à l’époque comme informaticien chez Asia Info Network 
à Fujisawa (Japon), lance le site bilingue anglais-japonais «The Languages of the 
World by Computers and the Internet», plus connu sous le nom de Logos Home 
Page ou Kotoba Home Page. Fort de cette expérience, il co-écrit ensuite (avec Kenji 
Sekine et Nobutoshi Kohara) le premier livre sur le sujet, «Pour un web multilingue», 
publié en japonais par les éditions O’Reilly Media en août 1997 avant d'être traduit 
l’année suivante en anglais, en allemand et en français. 

Yoshi raconte en décembre 1998: «Ma langue maternelle est le japonais. Comme 
j'ai suivi mes études de troisième cycle aux États-Unis et que j'ai travaillé dans 
l'informatique, je suis devenu bilingue japonais/anglais américain. J'ai toujours été 
intéressé par différentes langues et cultures, aussi j'ai appris le russe, le français 
et le chinois dans la foulée. À la fin de 1995, j'ai créé sur le web "The Languages 
of the World by Computers and the Internet" et j'ai tenté de donner - en anglais et 
en japonais - un bref historique des six principales langues utilisées sur l’internet, 
ainsi que les caractéristiques propres à chaque langue, sa phonétique, son jeu de 
caractères et son encodage informatique. Suite à l'expérience acquise, j'ai invité mes 
deux associés à écrire un livre sur la conception, la création et la présentation de 
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pages web multilingues, livre qui fut publié en août 1997 dans son édition japonaise, 
le premier livre au monde sur un tel sujet.» 

Plus généralement, «il y a des milliers d'années de cela, en Égypte, en Chine et 
ailleurs, les gens étaient plus sensibles au fait de communiquer leurs lois et leurs 
réflexions non seulement dans une langue mais dans plusieurs. Dans notre monde 
moderne, chaque État a le plus souvent adopté une seule langue de communication. 
À mon avis, l'internet verra l'utilisation plus grande de langues différentes et de pages 
multilingues - et pas seulement une gravitation autour de l'anglais américain - et un 
usage plus créatif de la traduction informatique multilingue. 99% des sites web créés 
au Japon sont en japonais!» 


1995 > Global Reach, pour localiser les sites web 
[Résumé] 

Bill Dunlap est le fondateur de Euro-Marketing Associates, une société de conseil 
en marketing qu'il lance en 1985 à Paris et San Francisco. En 1995, il restructure 
cette société en service de conseil en ligne dénommé Global Reach, le but étant 
de promouvoir les sites web des entreprises américaines dans d'autres pays, afin 
d'attirer plus de visiteurs, et donc d'augmenter les ventes. Cette méthode comprend 
la traduction d'un site web dans plusieurs langues, la promotion active du site, et 
enfin l'accroissement de la fréquentation locale au moyen de bandeaux publicitaires 
ciblés. Bill Dunlap explique en décembre 1998: «Promouvoir un site est aussi 
important que le créer, sinon plus. On doit être préparé à utiliser au moins autant 
de temps et d'argent à promouvoir son site qu'on en a passé à l'origine à le créer. 

Le programme Global Reach permet de promouvoir un site dans des pays non 
anglophones, afin d'atteindre une clientèle plus large... et davantage de ventes.» 


La société Global Reach se spécialise d’emblée dans l’internationalisation des sites 
web, tout comme leur localisation dans plusieurs langues. 

Bill Dunlap fonde d’abord Euro-Marketing Associates, une société de conseil en 
marketing qu'il lance en 1985 à Paris et San Francisco. En 1995, il restructure 
cette société en service de conseil en ligne dénommé Global Reach, le but étant 
de promouvoir les sites web des entreprises américaines dans d'autres pays, afin 
d'attirer plus de visiteurs, et donc d'augmenter les ventes. Cette méthode comprend 
la traduction d'un site web dans plusieurs langues, la promotion active du site, et 
enfin l'accroissement de la fréquentation locale au moyen de bandeaux publicitaires 
ciblés. 

Bill Dunlap explique en décembre 1998: «Il y a très peu de gens aux États-Unis qui 
sont intéressés de communiquer dans plusieurs langues. Pour la plupart, ils pensent 
encore que le monde entier parle anglais. Par contre, en Europe, les pays sont 
petits, si bien que, depuis des siècles, une perspective internationale est nécessaire. 
(...) 
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Depuis 1981, début de mon activité professionnelle, j'ai été impliqué dans la venue 
de sociétés américaines en Europe. Ceci est pour beaucoup un problème de langue, 
puisque leurs informations commerciales doivent être disponibles dans les langues 
européennes pour être prises en compte en Europe. Comme le web est devenu 
populaire en 1995, j'ai donné à ces activités une dimension "en ligne", et j'en suis 
venu à promouvoir le cybercommerce européen auprès de mes compatriotes 
américains. (...) 

Promouvoir un site est aussi important que le créer, sinon plus. On doit être préparé 
à utiliser au moins autant de temps et d'argent à promouvoir son site qu'on en a 
passé à l'origine à le créer. Le programme Global Reach permet de promouvoir un 
site dans des pays non anglophones, afin d'atteindre une clientèle plus large... avec 
davantage de ventes. Une société a de nombreuses bonnes raisons de considérer 
sérieusement le marché international. Global Reach est pour elle le moyen d'étendre 
son site web à de nombreux pays, de le présenter à des visiteurs en ligne dans leur 
propre langue, et de pénétrer le réseau de commerce en ligne présent dans ces 
pays.» 

Bill Dunlap ajoute en juillet 1999: «Une fois que la page d'accueil d'un site est 
disponible en plusieurs langues, l'étape suivante est le développement du contenu 
dans chaque langue. Un webmestre notera quelles langues attirent plus de visiteurs 
(et donc plus de ventes) que d'autres. Ce seront dans ces langues que débutera 
une campagne de promotion multilingue sur le web. Parallèlement, il est toujours 
bon de continuer à augmenter le nombre de langues dans lesquelles un site web 
est disponible. Au début, seule la page d'accueil traduite en plusieurs langues suffit, 
mais ensuite il est souhaitable de développer un véritable secteur pour chaque 
langue.» 


1996 > OneLook Dictionaries, point d'accès commun 
[Résumé] 

Robert Ware lance en avril 1996 le site OneLook Dictionaries en tant que point 
d’accès commun pour permettre une recherche rapide dans des centaines de 
dictionnaires généraux et spécialisés (affaires, informatique et internet, médecine, 
religion, sciences et techniques, sports, argot). Il explique en septembre 1998: «À 
titre personnel, je suis presque uniquement en contact avec des gens qui parlent 
une seule langue. (...) Être en contact avec le monde entier change cette approche 
des choses. Et la change en mieux ! (...) J'ai été long à inclure des dictionnaires 
non anglophones, en partie parce que je suis monolingue. Mais vous en trouverez 
maintenant quelques-uns.» OneLook Dictionaries compte 2 millions de termes 
provenant de 425 dictionnaires en 1998, 2,5 millions de termes provenant de 530 
dictionnaires en 2000, 5 millions de termes provenant de 910 dictionnaires en 2003 
et 1 9 millions de termes provenant de 1 .060 dictionnaires en 2010. 


Le site OneLook Dictionaries est lancé en avril 1996 par Robert Ware pour offrir un 
point d’accès commun à des centaines de dictionnaires en ligne. 
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Outre les dictionnaires généraux, ces dictionnaires concernent l’économie et 
les affaires, l’informatique et l’internet, la médecine, la religion, les sciences et 
techniques, le sport et l’argot. 

Robert Ware explique en septembre 1998: «À titre personnel, je suis presque 
uniquement en contact avec des gens qui parlent une seule langue et n'ont pas 
beaucoup de motivation pour développer leurs aptitudes linguistiques. Être en 
contact avec le monde entier change cette approche des choses. Et la change en 
mieux ! (...) J'ai été long à inclure des dictionnaires non anglophones, en partie parce 
que je suis monolingue. Mais vous en trouverez maintenant quelques-uns.» 

Robert raconte aussi dans le même entretien: «Un fait intéressant s'est produit par le 
passé qui a été très instructif pour moi. En 1994, je travaillais pour un établissement 
scolaire et j'essayais d'installer un logiciel sur un modèle d'ordinateur particulier. 

J'ai trouvé une personne qui était en train de travailler sur le même problème, et 
nous avons commencé à échanger des courriels. Soudain, cela m'a frappé... Le 
logiciel avait été écrit à quarante kilomètres de là, mais c'était une personne située 
à l'autre bout du monde qui m'aidait. Les distances et l'éloignement géographique 
n'importaient plus! Et bien, ceci est formidable, mais à quoi cela nous mène-t-il? Je 
ne puis communiquer qu'en anglais mais, heureusement, mon correspondant pouvait 
utiliser aussi bien l'anglais que l'allemand qui était sa langue maternelle. L'internet a 
supprimé une barrière, celle de la distance, mais il subsiste la barrière de la langue, 
bien réelle. 

Il semble que l'internet propulse simultanément les gens dans deux directions 
différentes. L'internet, anglophone à l'origine, relie les gens dans le monde entier. Par 
là-même, il favorise une langue commune pour communiquer. Mais il suscite aussi 
des contacts entre des personnes de langue différente et permet ainsi de développer 
un intérêt plus grand pour le multilinguisme. Si une langue commune est appréciable, 
elle ne remplace en aucun cas la nécessité de plusieurs langues. L'internet favorise 
ainsi à la fois une langue commune et le multilinguisme, et ceci est un facteur qui 
aide à trouver des solutions. L'intérêt croissant pour les langues et le besoin qu'on en 
a stimulent de par le monde la création de cours de langues et d'instruments d'aide 
linguistique, et l'internet fournit la possibilité de les rendre disponibles rapidement et 
à bon marché.» 

OneLook Dictionaries compte 2 millions de termes provenant de 425 dictionnaires en 
1998, 2,5 millions de termes provenant de 530 dictionnaires en 2000, 5 millions de 
termes provenant de 910 dictionnaires en 2003 et 19 millions de termes provenant 
de 1 060 dictionnaires en 2010. 


1997 > Un web anglophone à 82,3% 

[Résumé] 

L'internet est d’abord anglophone à pratiquement 100%, puisqu'il débute en 1974 
aux États-Unis en tant que réseau reliant les agences gouvernementales, les 
universités et les centres de recherche, grâce aux investissements considérables 
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du gouvernement, avant de s’étendre à la communauté anglophone puis au monde 
entier. Vingt ans plus tard, Babel, initiative conjointe de l'Internet Society et d’Alis 
Technologies, mène la première étude relative à la répartition des langues sur le 
web. Daté de juin 1997 et disponible en sept langues, le «Palmarès des langues de 
la toile» donne les pourcentages de 82,3% pour l'anglais, 4% pour l'allemand, 1 ,6% 
pour le japonais, 1 ,5% pour le français, 1,1% pour l'espagnol , 1,1% pour le suédois 
et 1% pour l'italien. Trois ans plus tard, en été 2000, 78% des pages web sont en 
anglais, et 50% des usagers sont non anglophones. 


En 1997, le web est anglophone à 82,3%, d’après Babel, un projet conjoint de 
l’Internet Society et d’Alis Technologies pour contribuer à l’internationalisation de 
l’internet. 

À ses débuts, l'internet est anglophone à pratiquement 100%, puisqu'il débute en 
1974 aux États-Unis en tant que réseau reliant les agences gouvernementales, les 
universités et les centres de recherche, grâce aux investissements considérables 
du gouvernement, avant de s’étendre à la communauté anglophone puis au monde 
entier. Son développement rapide est favorisé par l’invention du web en 1990 
par Tim Berners-Lee puis le lancement en novembre 1993 du premier navigateur 
Mosaic, ancêtre de Netscape. 

«Vers la communication sur internet dans toutes les langues...», tel est le sous- 
titre de la page d'accueil de Babel, une initiative de l’Internet Society et d’Alis 
Technologies. Pour mémoire, rappelons que l’Internet Society est fondée en 1992 
par Vinton Cerf pour favoriser le développement de l’internet et qu’Alis Technologies 
est une société spécialisée dans le traitement automatique des langues. 

En 1997, le site plurilingue (anglais, allemand, espagnol, français, italien, portugais, 
suédois) de Babel propose deux grands secteurs pour sa partie francophone: (a) 
un secteur «langues» en trois parties: langues du monde, glossaire typographique 
et linguistique, Francophonie; (b) un secteur «internet et multilinguisme» en deux 
parties: développer votre site web multilingue, codage des écritures du monde. 

Babel mène la première étude sur la répartition des langues sur le web et publie 
cette étude dans les sept langues du site. Disponible en ligne en juin 1997, le « 
Palmarès des langues de la toile » donne les pourcentages de 82,3% pour l'anglais, 
4% pour l'allemand, 1,6% pour le japonais, 1,5% pour le français, 1,1% pour 
l'espagnol, 1,1% pour le suédois et 1% pour l'italien. 

Ce pourcentage de 82,3% pour l’anglais peut s’expliquer par plusieurs facteurs: 

(a) l’usage de l'anglais en tant que principale langue d’échange internationale; (b) 
la création d’un grand nombre de sites web aux États-Unis et au Canada depuis 
les débuts du web en 1990; (c) une proportion d'usagers particulièrement forte 
en Amérique du Nord par rapport au reste du monde, les ordinateurs étant bien 
meilleur marché qu'ailleurs, tout comme la connexion à l'internet sous forme de forfait 
mensuel à prix modique. 
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Selon Global Reach, société spécialisée dans l’internationalisation et la localisation 
des sites web, les usagers non anglophones sont au nombre de 56 millions en 
juillet 1998, avec 22,4% d’usagers hispanophones, 12,3% d’usagers nippons, 14% 
d’usagers germanophones et 10% d’usagers francophones. Sur les 500 millions 
d’habitants que compte l’Europe, 15% sont de langue maternelle anglaise, 28% ne 
parlent pas l’anglais et 32% consultent des pages web en anglais. 

D’après Randy Hobler, un consultant en marketing internet de logiciels et services 
de traduction interviewé en septembre 1998, «l’augmentation de pages web dans 
d’autres langues que l’anglais n’est pas seulement due au fait qu’il y ait plus de sites 
et d’usagers dans des pays non anglophones, mais elle est également due au fait 
que les sociétés et les organisations localisent davantage leurs sites web et au fait 
qu’on utilise davantage la traduction automatisée pour proposer des sites web à 
partir ou vers d’autres langues.» 

Randy explique aussi: «Comme l’internet n’a pas de frontières nationales, les 
internautes s’organisent selon d’autres critères propres au médium. En termes de 
multilinguisme, vous avez des communautés virtuelles, par exemple ce que j’appelle 
les "nations de langues", tous ces internautes qu’on peut regrouper selon leur 
langue maternelle quel que soit leur lieu géographique. Ainsi la nation de la langue 
espagnole inclut non seulement les internautes d’Espagne et d’Amérique latine, mais 
aussi tous les Hispanophones vivant aux États-Unis, ou encore ceux qui parlent 
espagnol au Maroc.» 

Si Randy donne l'exemple d'une «nation de langue» hispanophone répartie sur 
trois continents, la même remarque vaut pour la Francophonie, une communauté 
de langue française présente sur cinq continents, ou encore la Créolophonie, une 
communauté de langue créole présente non seulement dans les Caraïbes mais aussi 
à Paris, Montréal et New York. 

Le pourcentage d’internautes habitant hors des États-Unis atteint les 50% en juillet 
1999. Le pourcentage d’usagers non anglophones atteint lui aussi les 50% en 
été 2000. Selon Global Reach, ce pourcentage est de 52,5% en été 2001 , 57% 
en décembre 2001 , 59,8% en avril 2002, 64,4% en septembre 2003 (dont 34,9% 
d’Européens non anglophones et 29,4% d’Asiatiques) et 64,2% en mars 2004 (dont 
37,9% d’Européens non anglophones et 33% d’Asiatiques). 


1997 > Une liste de langues européennes minoritaires 
[Résumé] 

En 1997, Caoimhin Ô DonnaNe est professeur d’informatique à l’Institut Sabhal 
Môr Ostaig, situé sur l’île de Skye, en Écosse. Il dispense ses cours en gaélique 
écossais. Il est également le webmestre du site de l’Institut, un site trilingue 
(gaélique écossais, gaélique irlandais, anglais) qui se trouve être la principale 
source d’information mondiale sur le gaélique écossais. Sur ce site, il tient à jour 
la page «European Minority Languages», une liste de langues européennes 
minoritaires elle aussi trilingue, avec classement par ordre alphabétique de langues 
et par famille linguistique. 
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*** 


Caoimhin Ô DonnaNe est professeur d’informatique à l’Institut Sabhal Môr Ostaig, 
situé sur l’île de Skye, en Écosse. Il dispense ses cours en gaélique écossais. Il est 
également le webmestre du site de l’Institut, un site trilingue (gaélique écossais, 
gaélique irlandais, anglais) qui se trouve être la principale source d’information 
mondiale sur le gaélique écossais. Sur ce site, il propose la page «European Minority 
Languages», une liste de langues européennes minoritaires elle aussi trilingue, avec 
classement par ordre alphabétique de langues et par famille linguistique. 

Interviewé en août 1998, Caoimhin détermine quatre points importants pour un 
internet plurilingue: «(a) L'internet a contribué et contribuera au développement 
fulgurant de l'anglais comme langue mondiale, (b) L'internet peut aussi grandement 
aider les langues minoritaires. Ceci ne se fera pas tout seul, mais seulement si les 
gens choisissent de défendre une langue, (c) Le web est très utile pour dispenser 
des cours de langues, et la demande est grande, (d) La norme Unicode (ISO 10646) 
pour les jeux de caractères est très importante et elle va grandement favoriser le 
multilinguisme sur le web.» 

Qu’en est-il du gaélique? Caoimhin explique en mai 2001 : «Nos étudiants utilisent 
un correcteur d’orthographe en gaélique et une base terminologique en ligne en 
gaélique. (...) Il est maintenant possible d’écouter la radio en gaélique (écossais 
et irlandais) en continu sur l’internet partout dans le monde. Une réalisation 
particulièrement importante a été la traduction en gaélique du navigateur Opéra. 

C’est la première fois qu’un logiciel de cette taille est disponible en gaélique.» 

Qu’en est-il des langues menacées? D’après Caoimhin, «l’internet accélère 
les choses dans les deux sens. Si les gens ne se soucient pas de préserver 
ces langues, l’internet et la mondialisation qui l’accompagne accéléreront 
considérablement leur disparition. Si les gens se soucient vraiment de les préserver, 
l’internet constituera une aide irremplaçable.» 


1997 > Une base terminologique européenne 
[Résumé] 

Géré par le service de traduction de la Commission européenne et disponible sur 
le web depuis 1997, Eurodicautom est une base terminologique multilingue de 
termes économiques, scientifiques, techniques et juridiques permettant de combiner 
entre elles les onze langues officielles de l'Union européenne (allemand, anglais, 
danois, espagnol, finnois, français, grec, hollandais, italien, portugais, suédois), 
ainsi que le latin, avec une moyenne de 120.000 consultations par jour en 2003. 

Fin 2003, Eurodicautom annonce son intégration dans une base terminologique 
plus vaste regroupant le contenu de toutes les bases de l'Union européenne et qui 
serait disponible dans une vingtaine de langues du fait de l’élargissement de l’Union 
européenne prévu l’année suivante. La base IATE (InterActive Terminology for 
Europe) est lancée en interne au printemps 2004 puis en externe sur le web en juin 
2007. 
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*** 


Eurodicautom est une base terminologique multilingue de termes économiques, 
scientifiques, techniques et juridiques permettant de combiner entre elles les onze 
langues officielles de l’Union européenne et le latin. 

Eurodicautom est l’oeuvre du Service de traduction de la Commission européenne. 
Initialement conçue pour aider les traducteurs en interne, la base terminologique est 
disponible sur le web en 1997 avec accès libre et gratuit pour pouvoir être utilisée 
par les fonctionnaires de l’Union européenne et les professionnels de langues de par 
le monde. Les onze langues officielles (allemand, anglais, danois, espagnol, finnois, 
français, grec, hollandais, italien, portugais, suédois) permettent de répondre aux 
besoins des 15 pays membres. 

Un projet de base terminologique plus vaste est évoqué dès 1999 pour fusionner 
le contenu de toutes les bases terminologiques de l’Union européenne et renforcer 
ainsi la coopération inter-institutionnelle. Outre la Commission européenne, 
les partenaires de ce projet sont le Parlement européen, le Conseil de l'Union 
européenne, la Cour de justice, la Cour des comptes européenne, le Comité 
économique et social européen, le Comité des régions, la Banque européenne 
d'investissement, la Banque centrale européenne et le Centre de traduction des 
organes de l'Union européenne. 

Fort de ses 120.000 consultations par jour, Eurodicautom annonce fin 2003 sa 
fermeture provisoire et son intégration dans une base plus vaste qui ne comporterait 
plus douze langues mais une vingtaine de langues, du fait de l'élargissement de 
l’Union européenne prévu l’année suivante (avec 25 pays membres en mai 2004 et 
27 pays membres en janvier 2007). 

La nouvelle base IATE (InterActive Terminology for Europe) voit le jour au printemps 
2004, d'abord pour un usage interne au sein des institutions de l'Union européenne, 
puis pour un usage externe libre et gratuit sur le web en juin 2007, avec 1 ,4 million 
d’entrées dans les 23 langues officielles de l'Union européenne (allemand, anglais, 
bulgare, danois, espagnol, estonien, finnois, français, grec, hongrois, irlandais, 
italien, letton, lituanien, maltais, néerlandais, polonais, portugais, roumain, slovaque, 
Slovène, suédois, tchèque), plus le latin. 

Le site web de IATE est administré par le Centre de traduction des organes de 
l'Union européenne à Luxembourg (capitale du pays du même nom) pour le compte 
des partenaires du projet. Comme expliqué dans la brochure de IATE, elle-même 
disponible en 23 langues, «les termes sont introduits dans la base de données 
par les terminologues et les traducteurs de l'Union européenne sur la base des 
informations fournies par les traducteurs, les administrateurs, les juristes-linguistes, 
les experts et d'autres sources fiables.» Selon la même brochure, IATE comprend 
8,4 millions de termes en 2010, dont 540.000 abréviations et 130.000 expressions. 
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1997 > Babel Fish, logiciel de traduction gratuit 


[Résumé] 

En décembre 1997, AltaVista est le premier moteur de recherche à lancer un 
service gratuit de traduction automatisée de l'anglais vers cinq autres langues 
(allemand, espagnol, français, italien, portugais) et vice versa, la page web 
originale et la traduction apparaissant en vis-à-vis à l'écran. Appelé aussi AltaVista 
Translation, Babel Fish est l'oeuvre de Systran, société pionnière dans le traitement 
automatique des langues. Babel Fish est alimenté par des dictionnaires multilingues 
comprenant 2,5 millions de termes. Bien qu'ayant ses limites, avec un texte traduit 
très approximatif, ce service est immédiatement plébicité par les 12 millions 
d'usagers que compte la toile de l'époque, dont un nombre croissant d'usagers non 
anglophones, et contribue grandement au plurilinguisme du web. 


En décembre 1997, le moteur de recherche AltaVista lance un logiciel de traduction 
gratuit de l’anglais vers cinq autres langues, dénommé Babel Fish ou AltaVista 
Translation, ce qui constitue une première sur le web. 

À cette date, l’annuaire Yahoo! propose déjà une interface en sept langues (anglais, 
allemand, coréen, français, japonais, norvégien, suédois) pour prendre en compte 
un nombre croissant d’usagers non anglophones. Le classement des sites en 
63 sections est plus pointu que celui d’AltaVista, où ces tâches sont entièrement 
automatisées. Lorsqu’une recherche ne donne pas de résultat dans Yahoo!, elle est 
automatiquement aiguillée vers AltaVista, et réciproquement. 

Babel Fish peut traduire une page web de l’anglais vers cinq autres langues 
(allemand, espagnol, français, italien, portugais) et vice versa, la page web originale 
et la traduction apparaissant en vis-à-vis à l’écran. On peut également traduire 
n’importe quel texte court en faisant un «copier-coller». Bien qu'ayant ses limites 
avec un texte traduit très approximatif, ce service est immédiatement plébicité par 
les 12 millions d'usagers que compte la toile de l'époque, dont un nombre croissant 
d’usagers non anglophones, et contribue grandement au plurilinguisme de l’internet. 

Alimenté par des dictionnaires multilingues comprenant 2,5 millions de termes, Babel 
Fish est l’œuvre de Systran, société pionnière dans le traitement automatique des 
langues. Selon le site web de Systran, «un logiciel de traduction automatique traduit 
une langue naturelle dans une autre langue naturelle. La traduction automatique 
prend en compte la structure grammaticale de chaque langue et elle utilise des 
règles pour transférer la structure grammaticale de la langue source (texte à traduire) 
vers la langue cible (texte traduit). La traduction automatique ne remplace pas et 
n'est pas destinée à remplacer le traducteur humain.» 

L'EAMT (European Association for Machine Translation) propose pour sa part 
la définition suivante sur son site: «La traduction automatique est l'utilisation de 
l'ordinateur pour la traduction de textes d'une langue naturelle à une autre. Elle 
fut un des premiers domaines de recherche en informatique. Il s'est avéré que 
cet objectif était difficile à atteindre. Cependant il existe aujourd'hui un certain 
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nombre de systèmes produisant un résultat qui, s'il n'est pas parfait, est de qualité 
suffisante pour être utile dans certaines applications spécifiques, en général dans le 
domaine de la documentation technique. De plus, les logiciels de traduction, qui sont 
essentiellement destinés à aider le traducteur humain à produire des traductions, 
jouissent d'une popularité croissante auprès d'organismes professionnels de 
traduction.» 

D’autres logiciels de traduction automatique seront ensuite développés par Alis 
Technologies, Lernout & Hauspie, Globalink et Softissimo, avec des versions 
payantes et/ou gratuites disponibles sur le web. Quant à Babel Fish, il déménagera 
sur le site de Yahoo! en mai 2008. 


1997 > Les outils de la société de traduction Logos 
[Résumé] 

En décembre 1997, la société de traduction Logos, basée à Modène, en Italie, 
avec des services en 35 langues, décide de mettre ses outils professionnels en 
accès libre sur le web pour en faire bénéficier la communauté internet. Le Logos 
Dictionary est un dictionnaire multilingue de 7,5 millions d'entrées (en septembre 
1998). La Wordtheque est une base de données multilingue de 328 millions de 
termes, constituée à partir de milliers de traductions, notamment des romans et des 
documents techniques, avec une recherche possible par langue, par mot, par auteur 
ou par titre. Linguistic Resources offre un point d'accès unique à 553 glossaires. 
L'Universal Conjugator propose des tableaux de conjugaison dans 17 langues. 

Dix ans plus tard, en 2007, la Wordtheque (devenue la Logos Library) comprend 
710 millions de termes, Linguistic Resources (qui n’a pas changé de nom) offre un 
point d’accès unique à 1.215 glossaires et Conjugation of Verbs (devenu l’Universal 
Conjugator) propose des tableaux de conjugaison dans 36 langues. 


Fin 1997, la société de traduction Logos décide de mettre ses outils professionnels 
en accès libre sur le web pour en faire bénéficier la communauté internet. 

Fondé en 1979 par Rodrigo Vergara à Modène (Italie), Logos propose des services 
de traduction dans 35 langues en 1997, avec 300 traducteurs travaillant sur place 
et un réseau mondial de 2.500 traducteurs travaillant en free-lance. La moyenne de 
production est de 200 textes par jour. 

Le principal outil professionnel en accès libre est le Logos Dictionary, un dictionnaire 
multilingue de 7,5 millions d'entrées (en septembre 1998). La Wordtheque est une 
base de données multilingue de 328 millions de termes, constituée à partir de milliers 
de traductions, notamment des traductions de romans et de documents techniques, 
avec une recherche possible par langue, mot, auteur ou titre. Linguistic Resources 
offre un point d'accès unique à 553 glossaires. L'Universal Conjugator propose des 
tableaux de conjugaison dans 17 langues. 


24 



Interviewé par Annie Kahn dans «Les mots pour le dire», un article du quotidien 
Le Monde daté du 7 décembre 1997, Rodrigo Vergara relate: «Nous voulions que 
nos traducteurs aient tous accès aux mêmes outils de traduction. Nous les avons 
donc mis à leur disposition sur internet, et tant qu’à faire nous avons ouvert le site 
au public. Cela nous a rendus très populaires, nous a fait beaucoup de publicité. 
L’opération a drainé vers nous de nombreux clients, mais aussi nous a permis 
d’étoffer notre réseau de traducteurs grâce aux contacts établis à la suite de cette 
initiative.» 

Annie Kahn, auteure de l’article, explique: «Le site de Logos est beaucoup plus 
qu'un dictionnaire ou qu'un répertoire de liens vers d'autres dictionnaires en ligne. 

L'un des piliers du système est un logiciel de recherche documentaire fonctionnant 
sur un corpus de textes littéraires disponibles gratuitement sur internet. Lorsque 
l'on recherche la définition ou la traduction d'un mot, "didactique" par exemple, on 
trouve non seulement le résultat recherché, mais aussi une phrase d'une oeuvre 
littéraire utilisant ce mot (en l'occurrence, un essai de Voltaire). Un simple clic 
permet d'accéder au texte intégral de l'œuvre ou de commander le livre grâce à un 
partenariat avec Amazon.com, le libraire en ligne bien connu. Il en est de même avec 
les traductions étrangères. Si aucun texte utilisant ce mot n'a été trouvé, le système 
fonctionne alors comme un moteur de recherche et renvoie aux sites web concernant 
ce mot. Pour certains termes, il est proposé d'en entendre la prononciation. Si une 
traduction manque, le système fait un appel au peuple. À chacun d'enrichir la base, 
les traducteurs de l'entreprise valident ensuite les traductions proposées.» 

Dix ans plus tard, en 2007, la Wordtheque (devenue la Logos Library) comprend 
710 millions de termes, Linguistic Resources (qui n’a pas changé de nom) offre un 
point d’accès unique à 1.215 glossaires et Conjugation of Verbs (devenu l’Universal 
Conjugator) propose des tableaux de conjugaison dans 36 langues. 


1997 > Des bases terminologiques spécialisées 
[Résumé] 

En 1997 et 1998, des organisations internationales mettent leurs bases 
terminologiques spécialisées en accès libre sur le web, par exemple la base 
ILOTERM de l’Organisation internationale du Travail (OIT), la base TERMITE de 
l'Union internationale des télécommunications (UIT) et la base WHOTERM de 
l'Organisation mondiale de la santé (OMS), ce qui leur permet d’être à la disposition 
des traducteurs et linguistiques du monde entier. Prenons l’exemple de la base 
terminologique de l’OMS. WHOTERM, acronyme de «WHO Terminology Information 
System», est une base terminologique trilingue (anglais, espagnol, français) dont 
le but est d’«améliorer la rigueur et la cohérence des textes rédigés, préparés ou 
traduits. Elle permet également à tous ceux qui collaborent à des programmes 
techniques de l'OMS d'enrichir les terminologies nouvelles, de promouvoir leur 
normalisation et de garantir leur diffusion.» 
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En 1997 et 1998, des organisations internationales mettent leurs bases 
terminologiques spécialisées en accès libre sur le web, ce qui leur permet d’être à la 
disposition des traducteurs et linguistiques du monde entier. 

C’est le cas par exemple pour la base ILOTERM de l’Organisation internationale du 
Travail (OIT), la base TERMITE de l'Union internationale des télécommunications 
(UIT) et la base WHOTERM de l'Organisation mondiale de la santé (OMS). 

ILOTERM est une base terminologique quadrilingue (allemand, anglais, espagnol, 
français) qui est l’oeuvre de l'Unité de terminologie et de références du Service des 
documents officiels (OFFDOC) de l'Organisation internationale du Travail (OIT). 
Comme indiqué sur le site web en 1998, «sa principale finalité est d'apporter des 
solutions, conformes à l'usage courant, à des problèmes terminologiques dans le 
domaine du travail et des questions sociales. Les termes figurent en anglais avec 
leurs équivalents en français, espagnol et/ou allemand. La base de données contient 
également (dans une à quatre langues) des articles concernant la structure et les 
programmes de l'OIT, les noms officiels d'institutions internationales, d'organismes 
nationaux et d'organisations nationales d'employeurs et de travailleurs, ainsi que les 
titres de réunions et d'instruments internationaux.» 

TERMITE - acronyme de «Base de données terminologique des 
Télécommunications de l'UlT» - est également quadrilingue (anglais, espagnol, 
français, russe) et géré par la Section de traduction de l'Union internationale des 
télécommunications (UIT). Comme indiqué sur le site web, «TERMITE contient tous 
les termes qui apparaissent dans tous les glossaires de l'UlT imprimés depuis 1980, 
ainsi que des termes plus récents en rapport avec les différentes activités de l'Union 
(en tout quelque 59.000 entrées). Normalement les collaborateurs qui s'occupent 
de l'amélioration et de la mise à jour de cette base de données sont des traducteurs 
ou des réviseurs techniques. TERMITE est surtout visité par les traducteurs 
internes mais aussi par des utilisateurs externes, travaillant dans le domaine des 
télécommunications.» 

WHOTERM - acronyme de «WHO Terminology Information System» - est la base 
terminologique trilingue (anglais, espagnol, français) de l’Organisation mondiale de 
la santé (OMS), dont le but est d’«améliorer la rigueur et la cohérence des textes 
rédigés, préparés ou traduits. Elle permet également à tous ceux qui collaborent 
à des programmes techniques de l'OMS d'enrichir les terminologies nouvelles, de 
promouvoir leur normalisation et de garantir leur diffusion.» 


1998 > La nécessité d’une «démocratie linguistique» 

[Résumé] 

Brian King, directeur du WorldWide Language Institute (WWLI), développe le concept 
de «démocratie linguistique» en septembre 1998: «Dans un rapport de l'UNESCO 
du début des années 1950, l'enseignement dispensé dans sa langue maternelle 
était considéré comme un droit fondamental de l'enfant. La possibilité de naviguer 
sur l'internet dans sa langue maternelle pourrait bien être son équivalent à l'Âge de 
l'Information. Si l'internet doit vraiment devenir le réseau mondial qu'on nous promet, 
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tous les usagers devraient y avoir accès sans problème de langue. Considérer 
l'internet comme la chasse gardée de ceux qui, par accident historique, nécessité 
pratique ou privilège politique, connaissent l'anglais, est injuste à l'égard de ceux qui 
ne connaissent pas cette langue.» 


Brian King, directeur du WorldWide Language Institute (WWLI), développe le concept 
de «démocratie linguistique» en septembre 1998. 

Il explique lors d’un entretien par courriel: «Dans un rapport de l'UNESCO du 
début des années 1950, l'enseignement dispensé dans sa langue maternelle était 
considéré comme un droit fondamental de l'enfant. La possibilité de naviguer sur 
l'internet dans sa langue maternelle pourrait bien être son équivalent à l'Âge de 
l'Information. Si l'internet doit vraiment devenir le réseau mondial qu'on nous promet, 
tous les usagers devraient y avoir accès sans problème de langue. Considérer 
l'internet comme la chasse gardée de ceux qui, par accident historique, nécessité 
pratique ou privilège politique, connaissent l'anglais, est injuste à l'égard de ceux qui 
ne connaissent pas cette langue.» 

Un facteur de développement d’un internet multilingue est «la compétition entre 
les grandes sociétés pour une part de marché global», avec «l'exportation des 
technologies de l'information dans le monde entier. La popularisation est maintenant 
effective à l'échelon mondial, et l'anglais n'est plus nécessairement la langue 
obligée de l'utilisateur. Il n'y a plus vraiment de langue indispensable, il y a les 
langues propres aux utilisateurs. Une chose est certaine: il n'est plus nécessaire de 
comprendre l'anglais pour utiliser un ordinateur, de même qu'il n'est plus nécessaire 
d'avoir un diplôme d'informatique. La demande des utilisateurs non anglophones - 
et l'effort entrepris par les sociétés de haute technologie se faisant concurrence pour 
obtenir les marchés mondiaux - ont fait de la localisation un secteur en expansion 
rapide dans le développement des logiciels et du matériel informatique.» 

Un autre facteur est le développement du commerce électronique: «De même que 
l'utilisateur non anglophone peut maintenant avoir accès aux nouvelles technologies 
dans sa propre langue, l'impact du commerce électronique peut constituer une force 
majeure qui fasse du multilinguisme la voie la plus naturelle vers le cyberespace. 

Les vendeurs de produits et services dans le marché virtuel mondial que devient 
l'internet doivent être préparés à desservir un monde virtuel qui soit aussi multilingue 
que le monde physique. S'ils veulent réussir, ils doivent s'assurer qu'ils parlent bien 
la langue de leurs clients!» 

C’est ce que fait Bill Dunlap, fondateur de Euro-Marketing Associates, une société 
de conseil en marketing qu'il lance en 1985 à Paris et San Francisco. En 1995, il 
restructure cette société en service de conseil en ligne dénommé Global Reach, le 
but étant de promouvoir en Europe les sites web des entreprises américaines, afin 
d'attirer plus de visiteurs, et donc d'augmenter les ventes. Cette méthode comprend 
la traduction d'un site web dans plusieurs langues (ce qu’on appelle la localisation 
d’un site), la promotion active des sites traduits et enfin l'accroissement de la 
fréquentation locale au moyen de bandeaux publicitaires ciblés. 
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Bill Dunlap écrit en décembre 1998: «Il y a très peu de gens aux États-Unis qui 
sont intéressés de communiquer dans plusieurs langues. Pour la plupart, ils 
pensent encore que le monde entier parle anglais. Par contre, en Europe, les pays 
sont petits, si bien que, depuis des siècles, une perspective internationale est 
nécessaire», d’où l’intérêt de son travail sur les deux continents. 

Coordinateur d'ELSNET (European Network of Excellence in Human Language 
Technologies), Steven Krauwer explique en septembre 1998: «En tant que citoyen 
européen, je pense que le multilinguisme sur le web est absolument essentiel. À 
mon avis, ce n'est pas une situation saine à long terme que seuls ceux qui ont 
une bonne maîtrise de l'anglais puissent pleinement exploiter les bénéfices du 
web. En tant que chercheur (spécialisé dans la traduction automatique), je vois le 
multilinguisme comme un défi majeur: pouvoir garantir que l'information sur le web 
soit accessible à tous, indépendamment des différences de langue.» 

Pour ce faire, il suggère plusieurs solutions pratiques: «(a) en ce qui concerne 
les auteurs: une meilleure formation des auteurs de sites web pour exploiter les 
combinaisons possibles permettant d'améliorer la communication en surmontant 
la barrière de la langue (et pas seulement par un vernis superficiel); (b) en ce qui 
concerne les usagers: des logiciels de traduction de type AltaVista Translation 
[Babel Fish], dont la qualité n'est pas frappante, mais qui a le mérite d'exister; (c) 
en ce qui concerne les logiciels de navigation: des logiciels de traduction intégrés, 
particulièrement pour les langues non dominantes, et des dictionnaires intégrés plus 
rapides à consulter.» 

Si l’internet gagne le monde entier avec l’anglais comme principale langue 
d’échange, tout le monde ne parle pas l’anglais, loin de là, et même ceux qui le 
lisent préfèrent consulter le web dans leur propre langue. Pour élargir leur champ 
d’action, les sociétés doivent donc proposer des sites bilingues, trilingues sinon 
plurilingues, en adaptant leur contenu à un public spécifique, que ce soit un pays 
ou une communauté linguistique. D’où la nécessité de l’internationalisation et de la 
localisation des sites, qui devient indispensable dans les années qui suivent, avec 
les sociétés et organismes anglophones proposant leurs sites à la fois en anglais et 
dans d’autres langues, et les sociétés et organismes non anglophones proposant 
leurs sites dans leur(s) propre(s) langue(s) et en anglais. 


1999 > Les dictionnaires bilingues de WordReference.com 
[Résumé] 

Michael Kellogg crée le site WordReference.com en 1999. Il raconte beaucoup 
plus tard sur son site: «J'ai débuté ce site en 1999 pour procurer des dictionnaires 
bilingues gratuits en ligne et d'autres outils pour tous sur l'internet. Depuis, le site 
s'est progressivement développé pour devenir l'un des sites de dictionnaires en 
ligne les plus utilisés, et le principal dictionnaire en ligne pour les paires de langues 
anglais-espagnol, anglais-français, anglais-italien, espagnol-français et espagnol- 
portugais. Ce site est toujours classé sans interruption parmi les 500 sites les plus 
visités du web.» WordReference.com offre également des forums linguistiques très 
actifs, tout comme des versions allégées de ses dictionnaires pour appareil mobile. 
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*** 


Michael Kellogg crée le site WordReference.com en 1999 pour procurer des 
dictionnaires bilingues gratuits en ligne. 

Il raconte beaucoup plus tard sur son site: «L'internet a été un incroyable outil ces 
dernières années pour rassembler des gens du monde entier. L'un des principaux 
obstacles à cela reste bien entendu la langue. Le contenu de l'internet est pour 
une grande part en anglais et de très nombreux usagers lisent ces pages alors 
que l'anglais est leur deuxième langue et non leur langue maternelle. De par mes 
propres expériences avec la langue espagnole, je sais que de nombreux lecteurs 
comprennent une grande partie de ce qu'ils lisent, mais pas la totalité. 

J'ai débuté ce site en 1999 pour procurer des dictionnaires bilingues gratuits en 
ligne et d'autres outils pour tous sur l'internet. Depuis, le site s'est progressivement 
développé pour devenir l'un des sites de dictionnaires en ligne les plus utilisés, et le 
principal dictionnaire en ligne pour les paires de langues anglais-espagnol, anglais- 
français, anglais-italien, espagnol-français et espagnol-portugais. Ce site est toujours 
classé sans interruption parmi les 500 sites les plus visités du web. Aujourd'hui, je 
suis heureux de continuer à améliorer ces dictionnaires, les autres outils linguistiques 
du site et les forums de langues.» 

En 2010, outre ces dictionnaires, WordReference.com propose un dictionnaire 
monolingue anglais ainsi que des dictionnaires de l'anglais vers d’autres langues 
(arabe, chinois, coréen, grec, japonais, polonais, portugais, roumain, tchèque, turc) 
et vice versa. Pour la langue espagnole, un dictionnaire monolingue voisine avec 
un dictionnaire de synonymes, un dictionnaire espagnol-français et un dictionnaire 
espagnol-portugais. Des tableaux de conjugaison sont disponibles pour l'espagnol, 
le français et l'italien. L’allemand et le russe disposent d’un dictionnaire monolingue. 
WordReference Mini est une version miniature du site pour intégration dans d'autres 
sites, par exemple des sites d'apprentissage de langues. Une version pour appareil 
mobile est disponible pour plusieurs dictionnaires, de l’anglais vers l’espagnol, le 
français et l’italien, et vice versa, avec d'autres paires de langues à venir. 


1999 > L’internet, outil indispensable pour les traducteurs 
[Résumé] 

L’internet devient un outil important pour les traducteurs, tout comme «une 
source indispensable et inépuisable d’informations», comme expliqué par Marcel 
Grangier, responsable de la section française des Services linguistiques centraux 
de l’Administration fédérale suisse. Il écrit en janvier 1999: «Travailler sans internet 
est devenu tout simplement impossible. Au-delà de tous les outils et commodités 
utilisés (messagerie électronique, consultation de la presse électronique, activités 
de services au profit de la profession des traducteurs), internet reste pour nous 
une source indispensable et inépuisable d'informations dans ce que j'appellerais 
le "secteur non structuré" de la toile. Pour illustrer le propos, lorsqu'aucun site 
comportant de l'information organisée ne fournit de réponse à un problème de 
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traduction, les moteurs de recherche permettent dans la plus grande partie des 
cas de retrouver le chaînon manquant quelque part sur le réseau.» Le service de 
Marcel Grangier gère notamment le répertoire Dictionnaires électroniques, une liste 
exhaustive de dictionnaires disponibles en ligne. 


L’internet devient un outil important pour les traducteurs, tout comme «une source 
indispensable et inépuisable d’informations». 

Marcel Grangier est responsable de la section française des Services linguistiques 
centraux de l’Administration fédérale suisse. Il explique en janvier 1999: «Travailler 
sans internet est devenu tout simplement impossible. Au-delà de tous les outils 
et commodités utilisés (messagerie électronique, consultation de la presse 
électronique, activités de services au profit de la profession des traducteurs), internet 
reste pour nous une source indispensable et inépuisable d'informations dans ce 
que j'appellerais le "secteur non structuré" de la toile. Pour illustrer le propos, 
lorsqu'aucun site comportant de l'information organisée ne fournit de réponse à un 
problème de traduction, les moteurs de recherche permettent dans la plus grande 
partie des cas de retrouver le chaînon manquant quelque part sur le réseau.» 

D’après lui, «le multilinguisme sur internet peut être considéré comme une fatalité 
heureuse et surtout irréversible. C'est dans cette optique qu'il convient de creuser 
la tombe des rabat-joie dont le seul discours est de se plaindre d'une suprématie 
de l'anglais. La suprématie de l’anglais n’est pas un mal en soi, dans la mesure où 
elle résulte de réalités essentiellement statistiques (plus de PC par habitant, plus 
de locuteurs de cette langue, etc.). La riposte n’est pas de "lutter contre l’anglais" et 
encore moins de s’en tenir à des jérémiades, mais de multiplier les sites en d’autres 
langues. Notons qu’en qualité de service de traduction, nous préconisons également 
le multilinguisme des sites eux-mêmes. La multiplication des langues présentes sur 
l'internet est inévitable, et ne peut que bénéficier aux échanges multiculturels. Pour 
que ces échanges prennent place dans un environnement optimal, il convient encore 
de développer les outils qui amélioreront la compatibilité. La gestion complète des 
diacritiques ne constitue qu'un exemple de ce qui peut encore être entrepris.» 

Géré par le service de Marcel Grangier, le répertoire Dictionnaires électroniques 
est liste très complète de dictionnaires monolingues (allemand, anglais, espagnol, 
français, italien), bilingues et multilingues disponibles en ligne, complétée par 
des répertoires d'abréviations et acronymes et des répertoires géographiques, 
essentiellement des atlas. Ce répertoire déménagera plus tard sur le nouveau site de 
la Conférence des Services de traduction des États européens (CST). 

Marcel Grangier précise en janvier 2000: "Les Dictionnaires électroniques ne sont 
qu’une partie de l’ensemble [du site web], et d’autres secteurs documentaires 
ont trait à l’administration, au droit, à la langue française, etc., sans parler des 
informations générales. (...) Conçu d’abord comme un service intranet, notre site web 
se veut en premier lieu au service des traducteurs opérant en Suisse, qui souvent 
travaillent sur la même matière que les traducteurs de l’Administration fédérale, mais 
également, par certaines rubriques, au service de n’importe quel autre traducteur où 
qu’il se trouve.» 
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Maria Victoria Marinetti, traductrice de nationalité mexicaine, est titulaire d'un 
doctorat en ingénierie. Elle raconte en août 1999: «J'ai accès à un nombre important 
d'informations au niveau mondial, ce qui est très intéressant pour moi. J'ai également 
la possibilité de transmettre ou de recevoir des fichiers, dans un va-et-vient 
d'information constant. L'internet me permet de recevoir ou d'envoyer des traductions 
générales ou techniques du français vers l'espagnol et vice versa, ainsi que des 
textes espagnols corrigés. Dans le domaine technique ou chimique, je propose 
une aide technique, ainsi que des informations sur l'exportation d'équipes de haute 
technologie vers le Mexique ou d'autres pays d'Amérique latine.» 

En ce qui concerne le multilinguisme, «il est très important de pouvoir communiquer 
en différentes langues. Je dirais même que c’est obligatoire, car l’information 
donnée sur l'internet est à destination du monde entier, alors pourquoi ne l’aurions- 
nous pas dans notre propre langue ou dans la langue que nous souhaitons 
utiliser? Information mondiale, mais pas de vaste choix dans les langues, ce serait 
contradictoire, pas vrai?» 

En 2000, l’internet est multilingue, et la moitié des usagers n’est pas de langue 
maternelle anglaise, mais la barrière de la langue est loin d'avoir disparu. Si toutes 
les langues sont désormais représentées sur le web, on oublie trop souvent que 
de nombreux usagers sont unilingues, et que même les polyglottes ne peuvent 
connaître toutes les langues. Il importe aussi d'avoir à l'esprit l'ensemble des 
langues, et pas seulement les langues dominantes. Il reste à créer des passerelles 
entre les communautés linguistiques pour favoriser la circulation des informations 
dans d'autres langues, notamment en améliorant la qualité des logiciels de 
traduction. 


1999 > La nécessité d’une information bilingue 
[Résumé] 

Henk Slettenhaar, professeur en technologies des communications à la Webster 
University de Genève (Suisse), insiste régulièrement sur la nécessité de sites 
d’information bilingues, dans la langue originale et en anglais. Il écrit en 1999 : «Les 
communautés locales présentes sur le web devraient en tout premier lieu utiliser leur 
langue pour diffuser des informations. Si elles veulent présenter ces informations à la 
communauté mondiale, celles-ci doivent être disponibles aussi en anglais. Je pense 
qu’il existe un réel besoin de sites bilingues. (...) À mon avis, il existe deux types 
de recherches sur le web. La première est la recherche globale dans le domaine 
des affaires et de l’information. Pour cela, la langue est d’abord l’anglais, avec des 
versions locales si nécessaire. La seconde, ce sont les informations locales de tous 
ordres dans les endroits les plus reculés. Si l’information est à destination d’une 
ethnie ou d’un groupe linguistique, elle doit d’abord être disponible dans la langue de 
l’ethnie ou du groupe, avec peut-être un résumé en anglais.» 
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Le web étant un médium à destination du monde, il paraît indispensable d’offrir des 
informations bilingues sinon plurilingues. 

Henk Slettenhaar est professeur à la Webster University de Genève (Suisse), 
où il enseigne les technologies des communications. Il insiste régulièrement 
sur la nécessité de sites d’information bilingues, dans la langue originale et en 
anglais. «Les communautés locales présentes sur le web devraient en tout premier 
lieu utiliser leur langue pour diffuser des informations, écrit-il en décembre 1998. 

Si elles veulent présenter ces informations à la communauté mondiale, celles-ci 
doivent être disponibles aussi en anglais. Je pense qu’il existe un réel besoin de 
sites bilingues. (...) Mais je suis enchanté qu’il existe maintenant tant de documents 
disponibles dans leur langue originale. Je préfère de beaucoup lire l’original avec 
difficulté plutôt qu’une traduction médiocre.» 

Il ajoute en août 1999: «À mon avis, il existe deux types de recherches sur le web. 

La première est la recherche globale dans le domaine des affaires et de l’information. 
Pour cela, la langue est d’abord l’anglais, avec des versions locales si nécessaire. La 
seconde, ce sont les informations locales de tous ordres dans les endroits les plus 
reculés. Si l’information est à destination d’une ethnie ou d’un groupe linguistique, 
elle doit d’abord être disponible dans la langue de l’ethnie ou du groupe, avec peut- 
être un résumé en anglais.» 

Guy Antoine crée en avril 1998 le site Windows on Haiti pour promouvoir la culture 
haïtienne et sa langue. Il croit toutefois en la nécessité de l'anglais en tant que 
langue commune et relate en novembre 1999: «Pour des raisons pratiques, l'anglais 
continuera de dominer le web. Je ne pense pas que ce soit une mauvaise chose, en 
dépit des sentiments régionalistes qui s'y opposent, parce que nous avons besoin 
d'une langue commune permettant de favoriser les communications à l'échelon 
international. L'internet peut héberger des informations utiles sur les langues 
minoritaires, qui seraient autrement amenées à disparaître sans laisser de traces. 

De plus, à mon avis, l'internet incite les gens à apprendre les langues associées 
aux cultures qui les intéressent. Ces personnes réalisent rapidement que la langue 
d'un peuple est un élément fondamental de sa culture. (...) Dans Windows on 
Haiti, la langue principale est l'anglais, mais on y trouve tout aussi bien un forum 
de discussion animé conduit en kreyôl [créole haïtien]. On y trouve également des 
documents sur Haïti en français et dans l'ancien créole colonial, et je suis prêt à 
publier d'autres documents en espagnol et dans diverses langues. Je ne propose 
pas de traductions, mais le multilinguisme est effectif sur ce site, et je pense qu'il 
deviendra de plus en plus la norme sur le web.» 

Bakayoko Bourahima est responsable de la bibliothèque de l’ENSEA (École 
nationale supérieure de statistique et d’économie appliquée) d'Abidjan, en Côte 
d’ivoire. Il écrit en juillet 2000: «Pour nous les Africains francophones, le diktat de 
l’anglais sur la toile représente pour la masse un double handicap d’accès aux 
ressources du réseau. Il y a d’abord le problème de l’alphabétisation qui est loin 
d’être résolu et que l’internet va poser avec beaucoup plus d’acuité, ensuite se pose 
le problème de la maîtrise d’une seconde langue étrangère et son adéquation à 
l’environnement culturel. (...) Nos systèmes éducatifs ont déjà beaucoup de mal à 
optimiser leurs performances, en raison, selon certains spécialistes, des contraintes 
de l’utilisation du français comme langue de formation de base. Il est donc de plus 
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en plus question de recourir aux langues vernaculaires pour les formations de base, 
pour "désenclaver" l’école en Afrique et l’impliquer au mieux dans la valorisation 
des ressources humaines. Comment faire? Je pense qu’il n’y a pas de chance 
pour nous de faire prévaloir une quelconque exception culturelle sur la toile, ce qui 
serait de nature tout à fait grégaire. Il faut donc que les différents blocs linguistiques 
s’investissent beaucoup plus dans la promotion de leur accès à la toile, sans oublier 
leurs différentes spécificités internes.» 

Bruno Didier, webmestre de la bibliothèque de l’Institut Pasteur, écrit en août 
1999: «Internet n’est une propriété ni nationale, ni linguistique. C’est un vecteur de 
culture, et le premier support de la culture, c’est la langue. Plus il y a de langues 
représentées dans leur diversité, plus il y aura de cultures sur internet. Je ne pense 
pas qu’il faille justement céder à la tentation systématique de traduire ses pages 
dans une langue plus ou moins universelle. Les échanges culturels passent par la 
volonté de se mettre à la portée de celui vers qui on souhaite aller. Et cet effort passe 
par l’appréhension de sa langue. Bien entendu c’est très utopique comme propos. 
Concrètement, lorsque je fais de la veille, je peste dès que je rencontre des sites 
norvégiens ou brésiliens sans un minimum d’anglais.» 

Alain Bron, consultant en systèmes d’information et écrivain, explique en novembre 
1999: «Il y aura encore pendant longtemps l'usage de langues différentes et tant 
mieux pour le droit à la différence. Le risque est bien entendu l'envahissement 
d'une langue au détriment des autres, donc l'aplanissement culturel. Je pense que 
des services en ligne vont petit à petit se créer pour pallier cette difficulté. Tout 
d'abord, des traducteurs pourront traduire et commenter des textes à la demande, et 
surtout les sites de grande fréquentation vont investir dans des versions en langues 
différentes, comme le fait l'industrie audiovisuelle.» 

Luc dall'Armellina, co-auteur et webmestre d’oVosite, un espace d’écriture 
hypermédia, écrit en juin 2000: «L'anglais s'impose sans doute parce qu'il est devenu 
la langue commerciale d'échange généralisée; il semble important que toutes 
les langues puissent continuer à être représentées parce que chacune d'elle est 
porteuse d'une vision "singulière" du monde. La traduction simultanée (proposée par 
AltaVista par exemple) ou les versions multilingues d'un même contenu me semblent 
aujourd'hui les meilleures réponses au danger de pensée unique que représenterait 
une seule langue d'échange. Peut-être appartient-il aux éditeurs des systèmes 
d'exploitation (ou de navigateurs?) de proposer des solutions de traduction partielle, 
avec toutes les limites connues des systèmes automatiques de traduction...» 

En été 2000, 50% des usagers de l'internet sont non anglophones. Le cap des 50% 
étant désormais franchi, il reste à diversifier les langues sur une toile dont 78% des 
pages sont encore en anglais. 


2000 > Encylopédies et dictionnaires en ligne 
[Résumé] 

Les premières encyclopédies de référence disponibles sur le web émanent de 
versions imprimées. C’est aussi le cas des dictionnaires en ligne. WebEncycIo est 
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mis en ligne par les éditions Atlas en décembre 1999 avec accès libre et gratuit, tout 
comme l’Encyclopaedia Universalis, mais avec accès payant. Le site Britannica.com 
est lui aussi mis en ligne à la même date pour proposer le contenu des 32 volumes 
de l’Encyclopaedia Britannica, d’abord en accès libre puis en accès payant. Les 
premiers dictionnaires de référence en ligne émanent eux aussi de versions 
imprimées. Le Dictionnaire universel francophone en ligne des éditions Hachette est 
disponible en accès libre dès 1997. Les 20 volumes de l'Oxford English Dictionary 
(OED) sont mis en ligne en mars 2000 avec accès payant. Conçu directement pour 
le web, le Grand dictionnaire terminologique (GDT) est mis en ligne en septembre 
2000 avec accès libre et gratuit. 


Les premières encyclopédies de référence disponibles sur le web émanent de 
versions imprimées. C’est aussi le cas des dictionnaires en ligne. 

Les encyclopédies 

WebEncycIo (aujourd'hui disparu), publié par les éditions Atlas, est la première 
grande encyclopédie francophone en accès libre, avec mise en ligne en décembre 
1999. La recherche est possible par mots-clés, thèmes, médias (à savoir les cartes, 
liens internet, photos et illustrations) et idées. Un appel à contribution incite les 
spécialistes d'un sujet donné à envoyer des articles, qui sont regroupés dans la 
section «WebEncycIo contributif». Après avoir été libre, l'accès est ensuite soumis à 
une inscription préalable gratuite. 

La version web de l'Encyclopaedia Universalis est elle aussi mise en ligne en 
décembre 1999, ce qui représente un ensemble de 28.000 articles signés de 4.000 
auteurs. Si la consultation est payante sur la base d'un abonnement annuel, de 
nombreux articles sont également en accès libre. 

Le site Britannica.com est mis en ligne à la même date, en tant que première grande 
encyclopédie anglophone en accès libre. Le site propose l'équivalent numérique 
des 32 volumes de l'Encyclopaedia Britannica (15e édition), en complément de la 
version imprimée et de la version CD-Rom, toutes deux payantes. Le site web offre 
aussi une sélection d'articles issus de 70 magazines, un guide des meilleurs sites, 
un choix de livres, etc., le tout étant accessible à partir d'un moteur de recherche 
unique. En septembre 2000, le site fait partie des cent sites les plus visités du 
web. En juillet 2001, la consultation devient payante sur la base d'un abonnement 
annuel ou mensuel. Beaucoup plus tard, en 2009, Britannica.com ouvre son site à 
des contributeurs externes, avec inscription obligatoire pour écrire et modifier des 
articles. 

Les dictionnaires 

Le premier grand dictionnaire de langue française en accès libre est le Dictionnaire 
universel francophone en ligne, qui répertorie 45.000 mots et 1 16.000 définitions 
tout en présentant «sur un pied d'égalité, le français dit "standard" et les mots 
et expressions en français tel qu'on le parle sur les cinq continents». Issu de la 
collaboration entre Hachette et l'AUPELF-UREF (devenu depuis l'AUF - Agence 
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universitaire de la Francophonie), il est mis en ligne dès 1997 et correspond à la 
partie «noms communs» du dictionnaire imprimé disponible chez Hachette. 


L'équivalent pour la langue anglaise est le site Merriam-Webster OnLine, qui donne 
librement accès au Collegiate Dictionary, au Collegiate Thésaurus et à d’autres outils 
linguistiques. 

En mars 2000, les 20 volumes de l'Oxford English Dictionary (OED) sont mis en 
ligne par l'Oxford University Press (OUP). La consultation du site est payante. 

Le dictionnaire bénéficie d'une mise à jour trimestrielle d'environ 1 .000 entrées 
nouvelles ou révisées. 

En mars 2002, deux ans après cette première expérience, l'Oxford University Press 
lance l'Oxford Reference Online (ORO), une vaste encyclopédie conçue cette fois 
directement pour le web et consultable elle aussi sur abonnement payant. Avec 
60.000 pages et un million d'entrées, elle représente l'équivalent d'une centaine 
d'ouvrages de référence. 

Un dictionnaire bilingue 

Conçu lui aussi directement pour le web, avec accès libre et gratuit, le Grand 
dictionnaire terminologique (GDT) est un dictionnaire bilingue français-anglais 
de trois millions de termes appartenant au vocabulaire industriel, scientifique et 
commercial. Sa mise en ligne en septembre 2000 est le résultat d'un partenariat 
entre l'Office québécois de la langue française (OQLF), auteur du dictionnaire, et 
Semantix, société spécialisée dans les solutions logicielles linguistiques. 

Dès le premier mois, le GDT est consulté par 1 ,3 million de personnes, avec 60.000 
requêtes par jour. La gestion du GDT est ensuite assurée par Convera Canada, avec 
3,5 millions de requêtes mensuelles en février 2003. Une nouvelle version du GDT 
est mise en ligne en mars 2003. La gestion du dictionnaire est désormais assurée 
par l'OQLF lui-même, et non plus par une société prestataire, avec l’ajout du latin 
comme troisième langue. 


2000 > Le portail yourDictionary.com 
[Résumé] 

Robert Beard, professeur de langues à l'Université Bucknell (États-Unis), crée 
d'abord en 1995 le site «A Web of Online Dictionaries» (800 liens en septembre 
1998), qui est un répertoire de dictionnaires en ligne dans diverses langues, auquel 
s'ajoutent d'autres sections: dictionnaires multilingues, dictionnaires anglophones 
spécialisés, thésaurus, vocabulaires, grammaires, glossaires et méthodes de 
langues. Une section appelée Linguistic Fun propose des outils linguistiques pour 
non spécialistes. Robert Beard cofonde ensuite le portail yourDictionary.com en y 
intégrant son site précédent, avec mise en ligne en février 2000. Le portail répertorie 
1 .800 dictionnaires dans 250 langues en septembre 2003, et 2.500 dictionnaires 
dans 300 langues en avril 2007. Soucieux de servir toutes les langues sans 
exception, le portail propose aussi l'Endangered Language Repository, une section 


35 



spécifique consacrée aux langues menacées. 


*** 


Professeur de langues à la Bucknell University (États-Unis), Robert Beard cofonde 
en février 2000 le portail yourDictionary.com, un portail pour toutes les langues sans 
exception qui intègre son premier site, «A Web of Online Dictionaries», créé en 1995. 

«A Web of Online Dictionaries» est un répertoire de dictionnaires en ligne dans 
diverses langues, auquel s'ajoutent d'autres sections: dictionnaires multilingues, 
dictionnaires anglophones spécialisés, thésaurus, vocabulaires, grammaires, 
glossaires et méthodes de langues, sans oublier une section proposant des outils 
linguistiques pour non spécialistes, sous le nom de Linguistic Fun. 

Robert Beard écrit en septembre 1998: «On a d'abord craint que le web représente 
un danger pour le multilinguisme, étant donné que le langage HTML et d'autres 
langages de programmation sont basés sur l'anglais et qu'on trouve tout simplement 
plus de sites web en anglais que dans toute autre langue. Cependant, le site web 
que je gère montre que le multilinguisme est très présent et que le web peut en fait 
permettre de préserver des langues menacées de disparition. Je propose maintenant 
des liens vers des dictionnaires dans 150 langues différentes et des grammaires 
dans 65 langues différentes. De plus, comme les concepteurs de logiciels de 
navigation manifestent une attention nouvelle pour la diversité des langues dans 
le monde, ceci va encourager la présence de davantage encore de sites web dans 
différentes langues.» 

Cinq ans après le lancement de son premier site, Robert Beard cofonde le portail 
yourDictionary.com, qui intègre son site précédent, avec mise en ligne du portail en 
février 2000. Il explique en janvier 2000 : «Nos nouvelles idées sont nombreuses. 
Nous projetons de travailler avec l'Endangered Language Fund aux États-Unis et en 
Grande-Bretagne pour rassembler des fonds pour cette fondation et nous publierons 
les résultats sur notre site. Nous aurons des groupes de discussion et des bulletins 
d'information sur les langues. Il y aura des jeux de langue destinés à se distraire et à 
apprendre les bases de la linguistique. La page Linguistic Fun deviendra un journal 
en ligne avec des extraits courts, intéressants et même amusants dans différentes 
langues, choisis par des experts du monde entier.» 

Soucieux de servir toutes les langues sans exception, le portail propose 
l'Endangered Language Repository, une section spécifique consacrée aux langues 
menacées. «Les langues menacées sont essentiellement des langues non écrites, 
explique Robert Beard à la même date. Un tiers seulement des quelque 6.000 
langues existant dans le monde sont à la fois écrites et parlées. Je ne pense 
pourtant pas que le web va contribuer à la perte de l’identité des langues et j’ai 
même le sentiment que, à long terme, il va renforcer cette identité. Par exemple, 
de plus en plus d’indiens d’Amérique contactent des linguistes pour leur demander 
d’écrire la grammaire de leur langue et de les aider à élaborer des dictionnaires. 

Pour eux, le web est un instrument à la fois accessible et très précieux d’expression 
culturelle.» 
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En septembre 2003, yourDictionary.com répertorie 1 .800 dictionnaires dans 250 
langues, ainsi que d’autres outils linguistiques: vocabulaires, grammaires, glossaires, 
méthodes de langues, etc. En avril 2007, 2.500 dictionnaires et grammaires sont 
disponibles dans 300 langues. 

Robert Beard écrivait de manière prémonitoire dès septembre 1998: «Le web sera 
une encyclopédie du monde faite par le monde pour le monde. Il n'y aura plus 
d'informations ni de connaissances utiles qui ne soient pas disponibles, si bien 
que l'obstacle principal à la compréhension internationale et interpersonnelle et au 
développement personnel et institutionnel sera levé. Il faudrait une imagination plus 
débordante que la mienne pour prédire l'effet de ce développement sur l'humanité.» 


2000 > Le Projet Gutenberg et les langues 
[Résumé] 

Le Projet Gutenberg est un projet visionnaire lancé en juillet 1971 par Michael Hart 
pour créer des versions électroniques gratuites d'oeuvres littéraires et les diffuser 
dans le monde entier. En 2010, le Projet Gutenberg compte plus de 33.000 ebooks 
de grande qualité ainsi que des dizaines de milliers de téléchargements par jour. 

Il dispose de sites web aux États-Unis, en Australie, en Europe et au Canada, 
avec 40 sites miroirs répartis sur toute la planète. Les livres numériques sont 
surtout en anglais, mais le multilinguisme est l'une des priorités du projet depuis 
la fin des années 1990. Le français est la deuxième langue. Soixante langues 
sont représentées en décembre 2010, grâce au patient travail de Distributed 
Proofreaders, un site web lancé en 2000 pour partager la relecture des livres entre 
des centaines de volontaires dans de nombreux pays. 


Le Projet Gutenberg est un projet visionnaire lancé en juillet 1971 par Michael Hart 
pour créer des versions électroniques gratuites d'oeuvres littéraires et les diffuser 
dans le monde entier. Au 15e siècle, Gutenberg avait permis à chacun d'avoir 
des livres imprimés pour un prix relativement modique. Au 21e siècle, le Projet 
Gutenberg permettrait à chacun d'avoir une bibliothèque numérique gratuite. 

Michael travaille depuis l’Illinois (États-Unis), dactylographiant des livres du domaine 
public, par exemple la Bible et les œuvres complètes de Shakespeare, d’abord seul 
puis avec l’aide de quelques volontaires. 

Son projet trouve un nouveau souffle et un rayonnement international avec 
l'apparition du web en 1990. Comme 95% des usagers de l’internet sont 
anglophones au début des années 1990, les livres numériques sont surtout en 
anglais. 

Le Projet Gutenberg inspire aussi d’autres bibliothèques numériques en Europe. 

Le Projekt Runeberg voit le jour en Suède en 1992 dans l’optique de numériser la 
littérature nordique (Scandinave) classique. Le Projekt Gutenberg-DE voit le jour en 
Allemagne en 1994 dans l’optique de numériser la littérature classique allemande. 
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Le français fut la deuxième langue du Projet Gutenberg, et c'est toujours le cas en 
2010. Les premiers livres disponibles en français sont six oeuvres de Stendhal et 
deux oeuvres de Jules Verne, toutes mises en ligne début 1997. 

Les deux romans de Jules Verne sont «De la terre à la lune» (publié en 1865) et «Le 
tour du monde en quatre-vingts jours» (publié en 1873). À cette date, les versions 
anglaises de ces romans sont déjà disponibles en version numérique depuis trois 
ans, tout comme la version anglaise de «Vingt mille lieues sous les mers» (publié 
en 1869-1870). Depuis 1994, Jules Verne a toujours fait partie des auteurs les plus 
téléchargés. 

En octobre 1997, Michael Hart annonce son intention d'intensifier la production de 
livres dans d’autres langues que l'anglais. Début 1998, outre dix titres en français, 
le catalogue comprend quelques oeuvres en allemand, espagnol, italien et latin. 
Disponible en mai 1999, l'eBook #2000 est «Don Quijote» (1605) de Cervantès, en 
espagnol, sa langue originale. En juillet 1999, Michael écrit lors d'un entretien par 
courriel: «J'introduis une nouvelle langue par mois maintenant, et je vais poursuivre 
cette politique aussi longtemps que possible.» 

Le Project Gutenberg trouve un second souffle avec le lancement de Distributed 
Proofreaders, un site lancé en octobre 2000 par Charles Franks pour partager la 
relecture des livres entre des centaines de volontaires dans de nombreux pays. 

Disponible en décembre 2000, l'eBook #3000 est le volume 3 (1919) de «À l'ombre 
des jeunes filles en fleurs» de Marcel Proust, en français. 

Disponible en octobre 2001, l'eBook #4000 est «The French Immortals Sériés» 
(Recueil de textes d'immortels français, 1905), en anglais. Cette anthologie regroupe 
des oeuvres de fiction courtes de plusieurs membres de l'Académie française: 

Émile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet et 
d'autres. 

Disponible en avril 2002, l'eBook #5000 est «The Notebooks of Leonardo da Vinci» 
(Les carnets de Léonard de Vinci), un version anglaise de ces carnets datant du 
16e siècle. Ce livre est depuis régulièrement présent dans le «Top 100» des livres 
téléchargés. 

On trouve des livres en 25 langues début 2004, en 42 langues en juillet 2005, y 
compris le sanscrit et les langues mayas, et en 60 langues en novembre 2010. 

Les dix langues principales sont l'anglais (avec 28.666 ebooks le 6 novembre 
2010), le français (1 .672 ebooks), l'allemand (715 ebooks), le finnois (542 ebooks), 
le néerlandais (498 ebooks), le portugais (474 ebooks), le chinois (405 ebooks), 
l'espagnol (297 ebooks), l'italien (253 ebooks) et le grec (107 ebooks). Ces langues 
sont suivies du latin, de l'espéranto, du suédois et du tagalog. 

Lorsque la traduction automatique aura atteint un taux de fiabilité de 99%, nous 
pourrons peut-être bénéficier un jour de la traduction immédiate de ces oeuvres 
littéraires dans un vaste choix de langues. Les livres traduits par le biais d'un logiciel 
de traduction automatique ne rivaliseront certainement pas avec le travail des 
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traducteurs littéraires et leurs efforts talentueux pendant des jours et des mois sinon 
des années. Mais ils permettraient au lecteur une première approche d'oeuvres 
littéraires jamais traduites jusqu'ici, ou traduites seulement dans quelques langues 
pour des raisons commerciales. 

Le texte d'un livre traduit (issu d'un logiciel de traduction) pourrait ensuite être corrigé 
par des traducteurs (des êtres humains, pas des logiciels), en utilisant une interface 
semblable à celle utilisée actuellement pour la correction du texte d'un livre (issu d'un 
logiciel OCR) par les volontaires de Distributed Proofreaders. Nous verrons peut-être 
un jour un Distributed Translators permettant de partager la révision des traductions, 
en tant qu’organisme partenaire de Distributed Proofreaders et du Projet Gutenberg. 


2001 > Wikipédia, encyclopédie collaborative 
[Résumé] 

Fondée en janvier 2001 à l'initiative de Jimmy Wales et Larry Sanger (Larry 
quitte plus tard l'équipe), Wikipédia est une encyclopédie gratuite en ligne écrite 
collectivement et dont le contenu est librement réutilisable. Sans publicité et financée 
par des dons, elle est rédigée par des milliers de volontaires, avec possibilité pour 
tout un chacun d’écrire, corriger ou compléter les articles, aussi bien les siens que 
ceux d’autres contributeurs. Les articles restent la propriété de leurs auteurs et leur 
libre utilisation est régie par la licence GFDL (GNU Free Documentation License) ou 
la licence Creative Commons. En décembre 2006, Wikipédia est l’un des dix sites les 
plus visités du web, avec 6 millions d'articles dans 250 langues. En 2009, Wikipédia 
est l'un des cinq sites les plus visités du web, le français étant la troisième langue 
de l’encyclopédie, après l’anglais et l’allemand. En janvier 201 1 , Wikipédia fête ses 
dix ans d’existence avec 17 millions d’articles dans 270 langues et 400 millions de 
visiteurs par mois pour l’ensemble de ses sites. 


Lancée en janvier 2001, Wikipédia est une encyclopédie gratuite en ligne écrite 
collectivement et dont le contenu est librement réutilisable. 

Qu’est-ce qu’un wiki? Un wiki (terme hawaïen signifiant «vite») est un site web 
permettant à plusieurs utilisateurs de collaborer simultanément en ligne, en rédigeant 
le contenu du wiki, en le modifiant et en l'enrichissant en permanence. Le wiki est 
utilisé par exemple pour créer et gérer des sites d’information, des dictionnaires 
et des encyclopédies. Le programme présent derrière l'interface d'un wiki est plus 
ou moins élaboré. Un programme simple gère des textes et des hyperliens. Un 
programme élaboré permet d'inclure des images, des graphiques, des tableaux, etc. 

Fondée à l’initiative de Jimmy Wales et Larry Sanger (Larry Sanger quitte plus tard 
l'équipe), Wikipédia est immédiatement très populaire. Sans publicité et financée 
par des dons, elle est rédigée par des milliers de volontaires - qui s'inscrivent sous 
un pseudonyme - avec possibilité pour tout un chacun d’écrire, corriger et compléter 
les articles, aussi bien les siens que ceux d'autres contributeurs. Les articles restent 
la propriété de leurs auteurs et leur libre utilisation est régie par la licence Creative 
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Commons ou la licence GFDL (GNU Free Documentation License). 

Créée en juin 2003, la Wikimedia Foundation gère non seulement Wikipédia mais 
aussi Wiktionary, un dictionnaire et thésaurus multilingue lancé en décembre 2002, 
Wikibooks (livres et manuels en cours de rédaction) lancé en juin 2003, auxquels 
s'ajoutent ensuite Wikiquote (répertoire de citations), Wikisource (textes appartenant 
au domaine public), Wikimedia Commons (sources multimédia), Wikispecies 
(répertoire d'espèces animales et végétales), Wikinews (site d'actualités) et enfin 
Wikiversity (matériel d'enseignement), lancé en août 2006. 

En décembre 2004, Wikipédia compte 1,3 million d’articles rédigés par 13.000 
contributeurs dans une centaine de langues. En décembre 2006, Wikipédia compte 
6 millions d’articles dans 250 langues et devient l'un de dix sites les plus visités du 
web. En mai 2007, 7 millions d'articles sont disponibles dans 192 langues, dont 
1 ,8 million d’articles en anglais, 589.000 articles en allemand, 500.000 articles en 
français, 260.000 articles en portugais et 236.000 articles en espagnol. En 2009, 
l’encyclopédie est l’un des cinq sites les plus visités du web. En septembre 2010, 
Wikipédia compte 14 millions d'articles dans 272 langues, dont 3,4 millions d’articles 
en anglais, 1,1 million d’articles en allemand et 1 million d’articles en français, qui est 
toujours la troisième langue de l'encyclopédie. 

Wikipédia fête ses dix ans en janvier 201 1 avec 17 millions d’articles dans 270 
langues et 400 millions de visiteurs par mois pour l’ensemble de ses sites. 

De plus, Wikipédia inspire bien d’autres projets au fil des ans, par exemple 
Citizendium, lancé en mars 2007 par Larry Sanger en tant qu’encyclopédie 
collaborative expérimentale au contenu vérifié par des experts, ou encore 
l’Encyclopedia of Life, un projet global qui voit le jour en mai 2007 pour recenser 
toutes les espèces animales et végétales connues. 


2001 > L’UNL, projet de métalangage numérique 
[Résumé] 

La Fondation UNDL (Universal Networking Digital Language) est fondée en janvier 
2001 à Genève (Suisse) pour développer et promouvoir le projet UNL (Universal 
Networking Language). Développé à partir de 1996 à Tokyo (Japon) sous l'égide 
de l'Institute of Advanced Studies (IAS) de l'Université des Nations Unies (UNU), 
le projet UNL est un projet de métalangage numérique - ou interlangue - formant 
une passerelle entre une langue source et une langue cible et offrant ainsi une 
solution aux problèmes de communication posés par la barrière des langues. 
Comme expliqué en 2010 sur le wiki du projet en langue française, «l'UNL est une 
langue artificielle créée pour prendre en compte les informations et connaissances 
véhiculées par les langues humaines. Elle est dotée de composantes lexicales, 
grammaticales et sémantiques, comme les langues naturelles. Couplée à 
l'intelligence artificielle, l'UNL facilite la communication entre l'homme et la machine, 
et par le biais de la machine, entre tous les peuples dans la langue maternelle de 
chacun.» 
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*** 


L'UNL (Universal Networking Language) est un projet de métalangage numérique 
pour l'encodage, le stockage, la recherche et la communication d'informations 
multilingues. 

Il s'agirait d'une interlangue formant une passerelle entre une langue source et une 
langue cible et offrant ainsi une solution au problème de communication posé par la 
barrière des langues. 

L’UNL est développé à partir de 1996 sous l'égide de l'Institute of Advanced Studies 
(IAS) de l'Université des Nations Unies (UNU) à Tokyo (Japon) au sein de l’UNL 
Programme, un programme international impliquant de nombreux partenaires dans 
plusieurs communautés linguistiques. 

En 1998, 120 chercheurs de par le monde travaillent sur un projet plurilingue 
comportant seize langues (allemand, anglais, arabe, brésilien, chinois, espagnol, 
français, hindou, indonésien, italien, japonais, letton, mongolien, russe, swahili, thaï). 

Au sein de l’IMAG (Institut d’informatique et de mathématiques appliquées de 
Grenoble), le GETA (Groupe d’étude pour la traduction automatique) participe 
à l’UNL Programme. Christian Boitet, son directeur, explique en septembre 
1998: «Il s'agit non de TAO [traduction assistée par ordinateur] habituelle, 
mais de communication et recherche d'information multilingue. Quatorze 
groupes ont commencé le travail sur douze langues (plus deux annexes) 
depuis début 1997. L'idée est de: (a) développer un standard, dit UNL, qui 
serait le HTML du contenu linguistique; (b) pour chaque langue, développer un 
générateur (dit "déconvertisseur") accessible sur un ou plusieurs serveurs, et 
un "enconvertisseur".» 

Les applications possibles sont le courriel multilingue, les informations multilingues, 
les dictionnaires numériques pour la lecture des langues étrangères sur le web et 
enfin la traduction automatique pour la navigation sur le web et la veille informatique. 

Quelles sont les perspectives? D’après Christian Boitet, «le plan général est d'ouvrir 
le projet aux autres langues de l'ONU en 2000. Il faudrait arriver à un état satisfaisant 
pour les douze autres avant. Du point de vue politique et culturel, ce projet est très 
important, en ce qu'il montre pour la première fois une voie possible pour construire 
divers outils soutenant l'usage de toutes les langues sur internet, qu'elles soient 
majoritaires ou minoritaires. En particulier, ce devrait être un projet majeur pour la 
Francophonie.» 

Ce programme se poursuit ensuite sous l'égide de la Fondation UNDL (Universal 
Networking Digital Language), créée en janvier 2001 à Genève (Suisse) pour 
développer et promouvoir le projet UNL, en partenariat avec les Nations Unies. 

Comme expliqué en 2010 sur le wiki en langue française du projet, «l'UNL est une 
langue artificielle créée pour prendre en compte les informations et connaissances 
véhiculées par les langues humaines. Elle est dotée de composantes lexicales, 
grammaticales et sémantiques, comme les langues naturelles. Couplée à 
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l’intelligence artificielle, l’UNL facilite la communication entre l’homme et la machine, 
et par le biais de la machine, entre tous les peuples dans la langue maternelle de 
chacun. Notre première tâche est de compléter le système UNL. Ensuite, le mettre 
au service des toutes les nations.» 


2001 > Un marché pour les logiciels de traduction 
[Résumé] 

En mars 2001, IBM se lance dans un marché de la traduction en pleine expansion 
avec un produit professionnel haut de gamme, le WebSphere Translation Server. 

Ce logiciel traduit instantanément en plusieurs langues (allemand, anglais, chinois, 
coréen, espagnol, français, italien, japonais) les pages web, courriels et chats. 

Il interprète 500 mots à seconde et permet l'ajout de termes spécifiques. Par 
ailleurs, des logiciels de traduction assistée par ordinateur (TAO), destinés aux 
traducteurs professionnels, incluent une «mémoire de traduction» avec gestion de 
la terminologie en temps réel et contrôle typographique, par exemple Wordfast, créé 
dès 1999 par Yves Champollion et compatible avec les autres grands logiciels du 
marché que sont le WebSphere Translation Server d'IBM et les logiciels de SDL 
Trados. Utilisable sur toute plateforme (Windows, Mac, Linux), Wordfast compte 
14.000 clients dans le monde en 2010, dont les Nations Unies, Coca-Cola et Sony. 


L’internationalisation de l’internet favorise un marché pour les logiciels de traduction, 
tout comme le développement du commerce électronique. 

Les sociétés Systran, Alis Technologies, Lernout & Hauspie, Globalink, Softissimo 
et bien d’autres développent des logiciels, produits et services ciblant trois types de 
clients: le grand public, les professionnels des langues et les sociétés localisant leurs 
sites web. 

En mars 2001, IBM se lance dans un marché en pleine expansion avec un produit 
professionnel haut de gamme, le WebSphere Translation Server. Ce logiciel traduit 
instantanément en plusieurs langues (allemand, anglais, chinois, coréen, espagnol, 
français, italien, japonais) les pages web, courriels et chats. Il interprète 500 mots à 
la seconde et permet l’ajout de vocabulaires spécifiques. 

Un logiciel de traduction automatique (TA) analyse le texte dans la langue à traduire 
(langue source) et génère automatiquement le texte dans la langue désirée (langue 
cible), en utilisant des règles précises pour le transfert de la structure grammaticale. 
L'être humain n'intervient pas au cours du processus, contrairement à la traduction 
assistée par ordinateur (TAO), qui implique une interaction entre l'homme et la 
machine. 

Par ailleurs, des logiciels de traduction assistée par ordinateur (TAO) sont proposés 
aux traducteurs professionnels. Lancé en 1999 à Paris par Yves Champollion, 
Wordfast est un logiciel incluant une «mémoire de traduction» avec gestion de la 
terminologie en temps réel et contrôle typographique. Il est compatible avec les 
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autres grands logiciels du marché que sont le WebSphere Translation Server d'IBM 
et les logiciels de SDL Trados. Utilisable sur toute plateforme (Windows, Mac, Linux), 
Wordfast compte 14.000 clients dans le monde en 2010, dont les Nations Unies, 
Coca-Cola, Sony et bien d’autres. 

Selon Tim McKenna, écrivain et philosophe, interviewé en octobre 2000, «lorsque la 
qualité des logiciels sera suffisante pour que les gens puissent converser par écrit 
et par oral sur le web en temps réel dans différentes langues, nous verrons tout 
un monde s'ouvrir à nous. Les scientifiques, les hommes politiques, les hommes 
d'affaires et bien d'autres groupes seront à même de communiquer immédiatement 
entre eux sans l'intermédiaire de médiateurs ou traducteurs.» 

Selon Randy Hobler, consultant en marketing internet de produits et services 
de traduction, l’étape suivante sera celle de la «transparence transculturelle et 
transnationale». 

Il explique dès septembre 1998: «Nous arriverons rapidement au point où une 
traduction très fidèle du texte et de la parole sera si commune qu'elle pourra faire 
partie des plateformes ou même des puces. À ce stade, lorsque le développement 
de l'internet aura atteint sa vitesse de croisière, lorsque la fidélité de la traduction 
atteindra plus de 98% et lorsque les différentes combinaisons de langues possibles 
auront couvert la grande majorité du marché, la transparence de la langue - 
à savoir toute communication d'une langue à une autre - sera une vision trop 
restrictive pour ceux qui vendent cette technologie. Le développement suivant sera 
la "transparence transculturelle et transnationale" dans laquelle les autres aspects 
de la communication humaine, du commerce et des transactions au-delà du seul 
langage entreront en scène. Par exemple, les gestes ont un sens, les mouvements 
faciaux ont un sens, et ceci varie en fonction des normes sociales d'un pays à l'autre. 
(...) 

Les cultures diffèrent de milliers de façons, et la plupart de leurs codes peuvent être 
modifiés par voie informatique lorsqu'on passe d’un code culturel à l'autre. Ceci inclut 
les lois, les coutumes, les habitudes de travail, l'éthique, le change monétaire, les 
différences de taille dans les vêtements, les différences entre le système métrique 
et le système de mesure anglophone, etc. Les firmes dynamiques répertorieront 
et programmeront ces différences, et elles vendront des produits et services afin 
d'aider les habitants de la planète à mieux communiquer entre eux. Une fois que ces 
produits et services seront largement répandus, ils contribueront réellement à une 
meilleure compréhension à l'échelle internationale.» 


2004 > Le web 2.0, communauté et partage 
[Résumé] 

Le terme «web 2.0» émane d'un éditeur de livres informatiques, Tim O'Reilly, qui 
l’utilise pour la première fois en 2004 en tant que titre d’une série de conférences 
qu'il est en train d’organiser. Le web 2.0 est caractérisé par les notions de 
communauté et de partage, avec une flopée de sites dont le contenu est alimenté 
par les utilisateurs, par exemple les blogs, les wikis, les sites sociaux et les 
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encyclopédies collaboratives. Wikipédia, Facebook et Twitter bien sûr, mais aussi 
des dizaines de milliers d'autres. Le web 2.0 tente de répondre au rêve formulé par 
Tim Berners-Lee, inventeur du web en 1990, qui écrit dans un essai daté d’avril 
1998: «Le rêve derrière le web est un espace d'information commun dans lequel 
nous communiquons en partageant l'information. Son universalité est essentielle, à 
savoir le fait qu'un lien hypertexte puisse pointer sur quoi que ce soit, quelque chose 
de personnel, de local ou de global, aussi bien une ébauche qu'une réalisation très 
sophistiquée.» 


Le terme «web 2.0» émane d'un éditeur de livres informatiques, Tim O'Reilly, qui 
l’utilise pour la première fois en 2004 en tant que titre d’une série de conférences 
qu'il est en train d’organiser. 

Le web 2.0 est caractérisé par les notions de communauté et de partage, avec une 
flopée de sites dont le contenu est alimenté par les utilisateurs, par exemple les 
blogs, les wikis, les sites sociaux et les encyclopédies collaboratives. Wikipédia, 
Facebook et Twitter bien sûr, mais aussi des dizaines de milliers d'autres. 

Les blogs envahissent la toile 

Un blog (ou blogue) est un journal en ligne tenu par une personne ou un groupe. 

Ce journal est le plus souvent présenté par ordre chronologique inversé (du plus 
récent au plus ancien) et il est actualisé d'heure en heure ou bien une fois par 
mois. Le premier blog apparaît en 1997. En 2004, Le Monde.fr, site du quotidien Le 
Monde, lance ses propres blogs, «un formidable format d'expression journalistique 
qui permet un dialogue quasi-instantané avec son lecteur», selon Yann Chapellon, 
directeur du Monde interactif. En juillet 2005, il y aurait 14 millions de blogs dans 
le monde, avec 80.000 nouveaux blogs par jour. En décembre 2006, Technorati, 
moteur de recherche pour blogs puis site spécialisé, recense 65 millions de blogs, 
avec 175.000 nouveaux blogs par jour. Certains blogs sont consacrés aux photos 
(photoblogs), à la musique (audioblogs ou podcasts) et aux vidéos (vidéoblogs ou 
vlogs). 

Les wikis, sites collaboratifs 

Un wiki (terme hawaïen signifiant «vite») est un site web permettant à plusieurs 
utilisateurs de collaborer en ligne sur un même projet. Le concept du wiki devient 
très populaire en 2000, avec possibilité pour les participants de contribuer à la 
rédaction du contenu, de modifier ce contenu et de l'enrichir en permanence. Le wiki 
est utilisé par exemple pour créer et gérer des sites d’information, des dictionnaires 
et des encyclopédies. Le programme présent derrière l'interface d'un wiki est plus 
ou moins élaboré. Un programme simple gère des textes et des hyperliens. Un 
programme élaboré permet d'inclure des images, des graphiques, des tableaux, etc. 
L'encyclopédie wiki la plus connue est Wikipédia. 

Facebook, réseau social 
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Facebook est un réseau social fondé en février 2004 par Mark Zuckerberg et ses 
collègues étudiants. Destiné à l'origine aux étudiants de l'Université de Harvard, 
puis aux étudiants de toutes les universités américaines, le réseau social s’ouvre 
au monde en septembre 2006 afin de connecter entre eux des personnes proches 
(famille, amis, collègues) ou des personnes partageant les mêmes centres d'intérêt. 
En juin 2010, Facebook devient le deuxième site mondial en nombre de visites, 
après Google, et fête ses 500 millions d'usagers tout en suscitant des débats sur le 
respect de la vie privée. 

Twitter, l'information en 140 caractères 

Lancé en 2006 par Jack Dorsey, Twitter est un outil de réseau social et de micro- 
blogging permettant à l'utilisateur d'envoyer gratuitement des tweets (messages brefs 
au format texte) de 140 caractères maximum, par messagerie instantanée, par SMS 
ou via l’internet. Parfois décrit comme le SMS de l'internet, Twitter gagne rapidement 
une popularité mondiale, avec 106 millions d'usagers en avril 2010 et 300.000 
nouveaux usagers par jour. Quant aux tweets, on compte 5.000 tweets quotidiens 
en 2007, 300.000 en 2008, 2,5 millions en 2009, 50 millions en janvier 2010 et 55 
millions en avril 2010, avec un archivage systématique des tweets à usage public par 
la Bibliothèque du Congrès en tant que reflet des tendances de notre époque. 

Le rêve de Tim Berners-Lee 

Comme on le voit, le web 2.0 tente de répondre au rêve formulé par Tim Berners- 
Lee, inventeur du web en 1 990, qui écrit dans un essai daté d’avril 1 998: «Le 
rêve derrière le web est un espace d'information commun dans lequel nous 
communiquons en partageant l'information. Son universalité est essentielle, à savoir 
le fait qu'un lien hypertexte puisse pointer sur quoi que ce soit, quelque chose de 
personnel, de local ou de global, aussi bien une ébauche qu'une réalisation très 
sophistiquée. Deuxième partie de ce rêve, le web deviendrait d'une utilisation 
tellement courante qu'il serait un miroir réaliste (sinon la principale incarnation) de la 
manière dont nous travaillons, jouons et nouons des relations sociales. Une fois que 
ces interactions seraient en ligne, nous pourrions utiliser nos ordinateurs pour nous 
aider à les analyser, donner un sens à ce que nous faisons, et voir comment chacun 
trouve sa place et comment nous pouvons mieux travailler ensemble.» (extrait 
de «The World Wide Web: A very short personal history») 


2007 > La norme ISO 639-3 pour identifier les langues 
[Résumé] 

Le premier standard est la norme ISO 639-1, adoptée par l’Organisation 
internationale de normalisation (ISO) en 1988 et qui identifie chaque langue sur deux 
lettres. Suit la norme ISO 639-2, publiée en 1998 pour identifier 400 langues sur trois 
lettres. Par ailleurs, l’Ethnologue, catalogue encyclopédique de langues vivantes 
publié par SIL International, développe également ses propres codes sur trois lettres 
dans sa base de données depuis 1971, avec inclusion de ces identifiants dans 
l’encyclopédie depuis 1984 (10e édition). En 2002, à l’invitation de l’Organisation 
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internationale de normalisation, SIL International prépare une nouvelle norme ISO 
qui harmonise les identifiants utilisés dans l'Ethnologue avec ceux de la norme ISO 
639-2, en intégrant aussi les identifiants des langues mortes et artificielles utilisés 
dans la Linguist List, une grande liste de diffusion à destination des linguistes. 

Publiée en 2007, la norme ISO 639-3 attribue un identifiant de trois lettres à 7.589 
langues. SIL International est également désigné comme l’organisme responsable de 
la gestion du cycle annuel des modifications et des mises à jour. 


Publiée en 2007, la norme ISO 639-3 attribue un identifiant de trois lettres à 7 589 
langues, par exemple « fra » pour le français. 

Cette norme existe depuis plus de trente ans. La première norme en vigueur est la 
norme ISO 639-1, adoptée par l’Organisation internationale de normalisation (ISO) 
en 1988 et qui identifie chaque langue sur deux lettres. 

Dix ans plus tard suit la norme ISO 639-2, adoptée en 1998 et qui identifie cette 
fois chaque langue au moyen de trois lettres mais se limite à 400 langues. Cette 
norme est la convergence de la norme ISO 639-1 avec la norme ANSI Z39.53 
(ANSI : American National Standards Institute). La norme ANSI correspond aux 
codes de langues MARC (Machine Readable Cataloging), des identifiants sur trois 
lettres développés par les bibliothèques américaines et adoptés en tant que norme 
nationale en 1987. 

Par ailleurs, un autre effort de codification est poursuivi par l’Ethnologue, 
magnifique catalogue encyclopédique de langues vivantes publié depuis 1950 
par SIL International, avec une nouvelle version tous les quatre ans. L’équipe de 
l’Ethnologue a elle aussi créé des codes de trois lettres pour chaque langue dans 
sa base de données, ce depuis 1971, avec inclusion des codes dans l'encyclopédie 
elle-même à partir de la 10 e édition (1984). 

Revenons à la norme ISO 639-2, qui devient vite insuffisante du fait du petit nombre 
de langues pris en compte. En 2002, l'ISO invite donc SIL International à établir 
une nouvelle norme qui harmoniserait les identifiants utilisés par l'Ethnologue 
avec les identifiants de la norme ISO 639-2, en y intégrant aussi les codes des 
langues mortes utilisés par la Linguist List, grande liste de diffusion à destination des 
linguistes. 

Le résultat, officiellement approuvé en 2006 et publié en 2007, est la norme ISO 639- 
3, qui attribue un code de trois lettres à 7 589 langues, avec un travail aussi exhaustif 
que possible puisque cette liste de codes inclut les langues vivantes ou mortes, 
anciennes ou artificielles, importantes ou minoritaires, écrites ou non écrites. 

SIL International est également désigné comme l'organisme responsable de 
l'enregistrement de nouvelles langues pour l'ISO 639-3, et gère donc le cycle annuel 
des modifications et des mises à jour. Au 21 e siècle, la préservation des langues 
passe par leur codification. 
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2007 > Google Traduction 


[Résumé] 

Lancé par Google en octobre 2007, Google Traduction est un service en ligne 
gratuit qui traduit instantanément un texte ou une page web dans une autre langue. 
Les usagers copient un texte dans l’interface web ou entrent une adresse web. Le 
service de traduction automatique de Google se base sur une analyse statistique et 
non sur une analyse traditionnelle basée sur des règles. Avant cette date, Google 
utilisait un traducteur de Systran du même type que Babel Fish dans Yahoo! Comme 
tout outil de traduction automatique, Google Traduction peut aider l’usager à 
comprendre le sens général d’un texte en langue étrangère, mais ne propose pas de 
traductions exactes. En 2009, le texte peut être lu par synthèse vocale, avec l’ajout 
de nouvelles langues au fil des mois. Disponible en juin 2009, Google Translator 
Toolkit est un service web permettant aux traducteurs de réviser les traductions 
générées automatiquement par Google Traduction. 


Lancé en octobre 2007, Google Traduction (Google Translate) est un service en 
ligne gratuit qui traduit instantanément un texte ou une page web dans une autre 
langue. Les usagers copient un texte dans l’interface web ou entrent une adresse 
web. 

Innovation par rapport à la concurrence, Google Traduction se base sur une analyse 
statistique pour la traduction automatique et non sur une analyse traditionnelle basée 
sur des règles. 

Google s’empresse lui aussi d’expliquer que ce nouveau service peut aider l’usager 
à comprendre le sens général d’un texte en langue étrangère, mais ne propose pas 
de traductions exactes. (En janvier 2011, les usagers ont le choix entre plusieurs 
traductions pour les mêmes mots.) 

Avant le lancement de Google Translate, Google utilisait un traducteur de Systran 
du même type que Babel Fish, avec plusieurs étapes quant aux paires de langues 
disponibles. 

Étape un: de l’anglais vers le français, l’allemand et l’espagnol, et vice versa. 

Étape deux: de l’anglais vers le portugais et le flamand, et vice versa. 

Étape trois: de l’anglais vers l’italien, et vice versa. 

Étape quatre: de l’anglais vers le chinois simplifié, le japonais et le coréen, et vice 
versa. 

Étape cinq (avril 2006): de l’anglais vers l’arabe, et vice versa. 

Étape six (décembre 2006): de l’anglais vers le russe, et vice versa. 

Étape sept (février 2007): de l’anglais vers le chinois traditionnel, et du chinois 
simplifié vers le chinois traditionnel, et vice versa. 

Voici les étapes propres au système de traduction de Google, tout au moins les dix 
premières. 
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Étape un (octobre 2007): toutes les langues disponibles jusqu’ici, avec toutes les 
combinaisons possibles. 

Étape deux: de l’anglais à l’hindou, et vice versa. 

Étape trois (mai 2008): bulgare, croate, danois, finlandais, grec, néerlandais, 
norvégien, polonais, roumain, suédois, tchèque, avec toutes les combinaisons 
possibles. 

Étape quatre (septembre 2008): catalan, hébreu, indonésien, letton, lituanien, 
philippin, serbe, slovaque, Slovène, ukrainien, vietnamien. 

Étape cinq (janvier 2009): albanais, estonien, galicien, hongrois, maltais, thaï, turc. 
Étape six (juin 2009): perse. 

Étape sept (août 2009): afrikaans, biélorusse, gallois, irlandais, islandais, 
macédonien, malais, swahili, yiddish. 

Étape huit (janvier 2010): haïtien créole. 

Étape neuf (mai 2010): arménien, azéri, basque, géorgien, ourdou. 

Étape dix (octobre 2010): latin. 

Etc. 

En 2009, nouvelle innovation, le texte peut être lu par synthèse vocale, avec l’ajout 
de nouvelles langues au fil des mois pour la synthèse vocale. 

La même année, deuxième innovation, Google lance le Google Translator Toolkit, 
un service web permettant aux traducteurs (humains) de réviser les traductions 
générées automatiquement par Google Traduction. Ils peuvent aussi partager 
traductions, glossaires et mémoires de traduction. 


2009 > 6.909 langues vivantes dans l’Ethnologue 
[Résumé] 

6.909 langues vivantes sont répertoriées dans la 16e édition (2009) de l’Ethnologue. 
Ce catalogue encyclopédique comprend deux versions: une version web gratuite 
depuis 1996 et une version imprimée payante depuis 1950. Une version CD- 
Rom payante est également disponible dans les années 1990 et abandonnée 
ensuite. Publiée par SIL International (SIL: Summer Institute of Linguistics), cette 
oeuvre de référence répertorie les langues selon divers critères (nom de la langue, 
famille linguistique, pays dans lequel la langue est parlée, identifiant de trois 
lettres, etc.) tout en offrant un moteur de recherche unique, des index et des cartes 
géographiques. Un petit groupe de chercheurs travaillant à Dallas, dans le Texas, 
coordonne le travail de milliers de linguistes qui glanent et vérifient des informations 
dans le monde entier. Une nouvelle version de l’Ethnologue est publiée tous les 
quatre ans environ. 


6.909 langues vivantes sont répertoriées dans la 16e édition (2009) de l’Ethnologue, 
un catalogue encyclopédique comprenant deux versions: une version web gratuite 
depuis 1996 et une version imprimée payante depuis 1950. 
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Une version CD-Rom payante est également disponible dans les années 1990 et 
abandonnée ensuite. 

Publié par SIL International (SIL: Summer Institute of Linguistics), cette oeuvre de 
référence, dont le titre complet est «The Ethnologue: Languages of the World», 
répertorie les langues selon divers critères (nom de la langue, famille linguistique, 
pays dans lequel la langue est parlée, identifiant de trois lettres, etc.) tout en offrant 
un moteur de recherche unique, des index et des cartes géographiques. Une 
nouvelle version de l’Ethnologue est publiée tous les quatre ans environ. 

Débuté en 1950 pour offrir un catalogue des langues minoritaires avant de s’élargir 
à toutes les langues vivantes de la planète, ce travail est mené sous l’égide d’une 
petite équipe de chercheurs basée à Dallas, dans le Texas. Cette équipe rassemble 
et organise la masse d'informations glanées et vérifiées une à une sur le terrain 
par des milliers de linguistes regroupés en équipes nationales et/ou linguistiques 
présentes sur tous les continents. 

Barbara Grimes, directrice de publication entre 1971 et 2000 (8e-14e éditions), 
relate en janvier 2000: «Il s’agit d’un catalogue des langues dans le monde, avec 
des informations sur les pays où elles sont parlées, une estimation du nombre de 
personnes qui les parlent, la famille linguistique à laquelle elles appartiennent, les 
autres termes utilisés pour ces langues, les noms de dialectes, diverses informations 
socio-linguistiques et démographiques, les dates des Bibles publiées, un index des 
noms de langues [Ethnologue Name Index], un index des familles linguistiques 
[Ethnologue Language Family Index] et enfin des cartes géographiques pour les 
langues.» 

Mais qu’est-ce exactement qu’une langue? Dans l'introduction de la 16e édition 
(2009) de l’Ethnologue, on peut lire ceci: «La manière dont chacun choisit de définir 
une langue dépend des motifs qu'on a d'identifier cette langue comme étant distincte 
d'une autre. Certains basent la définition d'une langue sur des raisons purement 
linguistiques. D'autres reconnaissent la nécessité de prendre également en compte 
des facteurs sociaux, culturels ou politiques. En outre, les locuteurs d'une langue 
ont souvent leurs propres critères sur l'appropriation d'une langue comme étant la 
leur. Ces critères sont souvent bien davantage liés à des questions de patrimoine et 
d'identité qu'aux traits linguistiques de la langue ou des langues en question.» 

Comme expliqué dans cette même introduction, une caractéristique de la base 
de données de l'Ethnologue depuis 1971 est un système de codes qui identifient 
chaque langue sur trois lettres (par exemple «fra» pour le français), avec inclusion 
des identifiants dans l'encyclopédie elle-même à partir de la 10e édition (1984). 

À l’invitation de l’Organisation internationale de normalisation (ISO) en 2002, 

SIL International prépare une nouvelle norme ISO permettant d'harmoniser les 
identifiants utilisés dans l'Ethnologue avec ceux de la norme ISO 639-2 (1998), 
en intégrant aussi les identifiants des langues mortes et artificielles utilisés dans 
la Linguist List, une grande liste de diffusion à destination des linguistes. Publiée 
en 2007, la nouvelle norme ISO 639-3 attribue un identifiant de trois lettres à près 
de 7.500 langues. SIL International est également désigné comme l’organisme 
responsable de la gestion du cycle annuel des modifications et des mises à jour. 
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2010 > Un atlas de l’UNESCO pour les langues menacées 


[Résumé] 

En 2010, dans le cadre de son programme de préservation des langues menacées, 
l’UNESCO (Organisation des Nations Unies pour l’éducation, la science et la 
culture) lance un atlas interactif des langues en danger dans le monde. La version 
en ligne gratuite est complémentaire de la version imprimée payante (3e édition, 
2010), réalisée sous la direction de Christopher Moseley, et disponible en anglais, 
en français et en espagnol, suite aux deux premières éditions publiées en 1996 
et 2001 . L’atlas interactif comprend 2.473 langues en juin 2011, avec un moteur 
de recherche par pays ou région, par nom de langue, par nombre de locuteurs, 
par vitalité et par code ISO 639-3. Les noms des langues sont indiqués dans leurs 
transcriptions en français, en anglais et en espagnol. Les noms alternatifs (variantes 
orthographiques, dialectes ou noms en caractères non latins) sont également fournis 
dans de nombreux cas. 


En 2010, dans le cadre de son programme de préservation des langues menacées, 
l’UNESCO (Organisation des Nations Unies pour l’éducation, la science et la culture) 
lance un atlas interactif des langues en danger dans le monde. 

La version en ligne gratuite est complémentaire de la version imprimée payante, 
la dernière édition en date étant la 3 e édition (2010), réalisée sous la direction de 
Christopher Moseley et publiée en trois langues (français, anglais, espagnol). Les 
deux premières éditions datent respectivement de 1996 et 2001 . 

L’atlas interactif comprend 2.473 langues en juin 201 1 , avec un moteur de recherche 
par pays ou région, par nom de langue, par nombre de locuteurs de/à, par vitalité et 
par code ISO 639-3. 

Les noms des langues sont indiqués dans leurs transcriptions en français, en anglais 
et en espagnol. Les noms alternatifs (variantes orthographiques, dialectes ou noms 
en caractères non latins) sont également fournis dans de nombreux cas. 

La vitalité des langues 

Le rapport de l’UNESCO sur la vitalité et le danger de disparition des langues établit 
six niveaux de vitalité: sûre, vulnérable, en danger, sérieusement en danger, en 
situation critique, éteinte. 

«Sûre» signifie que la langue est parlée par toutes les générations et que la 
transmission intergénérationnelle est ininterrompue. Les langues concernées ne sont 
donc pas incluses dans l’atlas. 

«Vulnérable» signifie que la plupart des enfants parlent la langue, mais qu’elle est 
restreinte à certains domaines, par exemple la maison. 
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«En danger» signifie que les enfants n’apprennent plus la langue comme langue 
maternelle à la maison. 

«Sérieusement en danger» signifie que la langue est parlée par les grands-parents. 

Si la génération des parents peut la comprendre, les parents ne la parlent pas entre 
eux ou avec les enfants. 

«En situation critique» signifie que les locuteurs les plus jeunes sont les grands- 
parents et leurs ascendants, et qu’ils ne parlent la langue que partiellement et peu 
fréquemment. 

«Éteinte» signifie qu’il n’y a plus de locuteurs. L’atlas inclut les langues éteintes 
depuis les années 1950. 

Comment définir une langue en péril 

À quel moment une langue est-elle considérée comme en péril? Comme expliqué 
par l’UNESCO sur le site de l’atlas interactif, «une langue est en péril lorsque ses 
locuteurs cessent de l’utiliser, réservent son usage à des domaines de plus en plus 
restreints, emploient un moins grand nombre de registres ou de styles de parole, et/ 
ou arrêtent de la transmettre à la génération suivante. Aucun facteur ne détermine à 
lui seul si une langue est en danger.» 

Selon les experts de l’UNESCO, il importe de considérer les neuf critères suivants: 

(1) la transmission de la langue d’une génération à l’autre, (2) le nombre absolu 
de locuteurs, (3) le taux de locuteurs par rapport à l’ensemble de la population, 

(4) l’utilisation de la langue dans les différents domaines publics et privés, (5) la 
réactivité d’une langue face aux nouveaux domaines et médias, (6) l’existence 
de matériels d’apprentissage et d’enseignement de la langue, (7) les attitudes 
et politiques linguistiques au niveau du gouvernement et des institutions, y 
compris son usage et son statut au niveau officiel, (8) les attitudes des membres 
de la communauté vis-à-vis de leur propre langue, (9) le type et la qualité de la 
documentation. 

Quels sont les facteurs de disparition d’une langue? Selon les mêmes experts, «une 
langue disparaît lorsqu’elle n’a plus de locuteurs ou que ceux-ci se mettent à parler 
une autre langue - en général, une langue de plus grande importance utilisée par 
un groupe plus puissant. Les langues sont menacées par des forces externes telles 
qu’une domination militaire, économique, religieuse, culturelle ou éducative, ou par 
des forces internes comme l’attitude négative d’une population à l’égard de sa propre 
langue. Aujourd’hui, les migrations accrues et l’urbanisation rapide s’accompagnent 
souvent de la perte des modes de vie traditionnels et d’une forte pression en faveur 
de l’utilisation d’une langue dominante qui est nécessaire - ou perçue comme telle - à 
une vraie participation totale à la vie civique et au progrès économique.» 
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